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(57) Abstract 

A DNA fragment coding for a modified nuclear glucocorticoid receptor, particularly one mutated in the region coding for the ligand 
binding domain, so that receptor activity is more strongly inducible by a synthetic glucocorticoid ligand than by a natural glucocorticoid 
ligand, is disclosed. A recombination system inducible in mammals by means of a fusion protein produced between a recombinase and 
the binding domain of the ligand derived from the modified glucocorticoid receptor of which the activity is more strongly inducible by 
synthetic glucocorticoids than by natural glucocorticoids, is also disclosed. 

(57) Abregl 

La prfsente invention concerne un fragment d'ADN codant pour un recepteur nucleaire de glucocorticoldes modified notamment mute* 
dans la region codant pour le domaine de liaison du ligand, de sorte que Tactivite dudit recepteur est inductible plus fortement par un 
ligand glucocorticoTde symhdtique que par un ligand glucocorticoide naturel. La prfsente invention concerne egalement un systeme de 
recombinaison inductible chez les mammrferes, grace a l'utilisation d'une proteme de fusion realisee entre une recombinase, et le domaine 
de liaison du ligand, denv6 du recepteur des glucocorticoldes modine\ dont Kactivte est plus fortement inductible par des glucocorticoldes 
synth&iques, que par des glucocorticoldes naturels. 
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RECEPTEUR NUCLEAIRE DE GLUCOCORTICOIDES MODIFIE, PROTEINE DE FUSION, 
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5 

La presente invention concerne un fragment d'ADN codant pour un 
recepteur nucleaire de glucocorticoides (GR) modifie, et un fragment 
d'ADN codant pour un domaine de liaison du ligand (LBD) dudit recepteur, 
ainsi qu'un fragment d'ADN codant pour une proteine de fusion 

10 comportant ledit recepteur ou ledit domaine de liaison du ligand dudit 
recepteur fusionne a une proteine dont Pactivite est induite en presence 
de ligands glucocorticoides. 

La presente invention concerne egalement un recepteur nucleaire 
de glucocorticoides modifie, notamment le recepteur humain et son 

15 domaine de liaison du ligand modifie, ainsi qu'une proteine de fusion 
comportant ledit recepteur ou ledit domaine de liaison du ligand. 

La presente invention concerne egalement un vecteur d'expression 
conditionnelle d'une proteine, notamment une proteine etrangere dans 
des cellules hotes humaines ou animales, notamment des cellules de 

20 mammiferes. La presente invention se rapporte aussi a un proc^de 
depression d'une proteine dans lesdites cellules. Par ailleurs, la presente 
invention concerne un procede d'excision, insertion, inversion, ou 
translocation conditionnelle d'un fragment d'ADN dans des cellules hotes 
humaines ou animales, notamment de mammiferes. 

25 La presente invention concerne en outre un vecteur de transfert 

d'un fragment d'ADN dans lesdites cellules hotes humaines ou animales, 
notamment de mammiferes, et son utilisation comme medicament, comme 
outil d'analyse et etude du fonctionnement d'un gene ainsi qu'une 
methode de traitement de cellules ex vivo ou in vitro. 

30 Enfin, la presente invention concerne les cellules humaines ou 

animales transfectees par un vecteur d'expression et/ou de transfert selon 
Tinvention ainsi que les animaux transgeniques qui en derivent. 
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Le recepteur des glucocorticoides (GR) est une proteine regulatrice 
de transcription de genes qui medie Taction des glucocorticoides dans les 
cellules cibles. Le GR et d'autres membres de la superfamille des 
recepteurs nucleaires (facteurs de transcription actives par des ligands) 
5 presentent une structure modulaire commune. La region N-terminale 
variable contient Pactivite de transactivation constitutive AF-1. Le 
domaine central de liaison a l'ADN (DBD) est hautement conserve entre les 
differentes especes et permet la liaison du recepteur a son element de 
reponse ADN apparente (GRE dans le cas du GR). Le domaine de liaison du 

10 ligand (LBD), localise dans la region C-terminale du GR, non seulement 
fixe le ligand, mais egalement comporte de multiples activites distinctes : 
une surface pour l'interaction avec hsp90 et une surface distincte pour 
rhomodimerisation, un signal de localisation nucleaire et une fonction dc 
transactivation AF-2 dependant du ligand (pour les articles de synthese et 

15 references, voir (1-5)). Le domaine LBD est fortement conserve entre les 
differentes especes. Une fonction dc transactivation AF-2 a ete identifie 
dans la partie C-terminale de divers LBD (6-10). L'integrite de la partie 
centrale de la region contenant AF-2 est requisc pour l'activation de 
transcription, dependante de ligand, par les recepteurs nucleaires 

20 correspondants, et pour l'interaction, entre cette region et des facteurs 
intermediates transcriptionnels apparentes (TIF, egalement denommes 
co-activateurs ou mediateurs) (11-19). II a etc propose un modele general 
(19) dans lequel la liaison du ligand induit un changement 
conformationnel du domaine de liaison du ligand en faisant intervenir en 

25 particulier la region C-terminale hebergeant la partie centrale de AF-2, en 
engendrant ainsi une surface pour une interaction efficace avec les TIF. 
Les LBD des recepteurs nucleaires contiennent des regions conservees 
possedant une structure canonique en helice. Ces donnees structurales ont 
permis d'effectuer un alignement commun pour les LBD de tous les 

30 recepteurs nucleaires. L'helice HI 2 contient la fonction de transactivation 
AF-2 (19). Les acides amines des helices Hll et H12, notamment des 
recepteurs des glucocorticoides de differentes especes telles que l'homme, 
lc rat, la souris et le xenope, sont conserves. 
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Plusieurs mutations dans le LBD de GR ont ete decrites 
precedemment. On peut distinguer deux types majeurs de mutations : 

- le premier type consiste en mutations qui affectent positivement 
ou negativement I'affinite de liaison au ligand. Par exemple, les 

5 remplacements du residu cysteine 656 par la glycine dans le GR de 

rat (20) et du residu methionine 565 par Targinine ou du residu 
alanine 573 par la glutamine dans le GR humain (hGR)(21) 
augmentent I'affinite de liaison au ligand et conduisent a un 
decalage de la courbe de reponse en fonction de la dose pour la 

10 transactivation en direction des plus basses concentrations de 

ligand. Ces mutants sont par consequent designes par "super GR". 
De meme, on a rapporte des mutants ayant une affinite de liaison au 
ligand plus faible (21-24). Les mutations de LBD qui decalent la 
courbe de reponse en fonction de la dose de ligand en direction des 

15 plus hautes concentrations de ligand, resultent d'une affinite 

alteree de liaison de l'hormone (25-26) ; 

- le second groupe de mutants LBD comprend ceux affectant la 
fonction d'activation transcriptionnelle (AF-2), sans alterer la 
liaison au ligand. Comme exemples, on peut citer des mutations dans 

20 la region contenant AF-2 qui sont liees a une perte ou une 

diminution du potentiel de transactivation, mais n'affectent pas 
I'affinite de liaison au ligand (6-10). 

La fusion du domaine de liaison du ligand (LBD) de recepteurs 
nucleaires a des proteines heterologues a permis de controler, dans de 

25 nombreux cas, Tactivite de ces dernieres. 

Les activites de Myc, c-Abl, Src, erbBl, Raf, El A Cre et FL1\ peuvent 
etre modulees en rcalisant des proteines de fusion avec le LBD de 
recepteurs nucleaires (27-29). Cependant, les ligands de ces recepteurs 
sont presents dans de nombreux syst£mes biologiqucs, pouvant ainsi 

30 induire un niveau d'activite basal. Pour eviter de tels problemes, un LBD 
mute du recepteur des oestrogenes (RE), a ete fusionne a la proteine c-Myc 
(30), ou aux recombinases Cre et FLP (28 et 29). 
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Les recombinases de la famille des integrascs k catalysent Pexcision, 
Pinsertion, Pinversion ou la translocation de fragments d'ADN au niveau 
de sites specifiques de reconnaissance desdites recombinases (31-36). Les 
recombinases sont actives dans les cellules animales (35). 
5 La recombinase Cre, une integrase de 38 KDa du bacteriophage PI, 

catalyse la recombinaison entre deux sequences d'ADN de 34 paires de 
bases appelees loxP en Pabsence de cofacteurs (32, Figure 1). 

La position sur une ou plusieurs molecules d'ADN et Porientation de 
sites loxP Tun par rapport a Pautre determinent le type de fonction de la 

10 recombinase, excision, insertion, inversion ou translocation notamment, 
la recombinase Cre (figure 1). Ainsi Pactivite recombinase de Cre est une 
inversion lorsque deux sites LoxP sont tete-beche sur un meme fragment 
d'ADN et une excision, lorsque les sites LoxP sont en repetition directe sur 
un meme fragment d'ADN. L'activite de la recombinase est une insertion 

15 lorsqu'un site loxP est present sur un fragment d'ADN, une molecule 
d'ADN telle qu'un plasmide contenant un site loxP pouvant etre inseree au 
niveau dudit site loxP (figure 1). La recombinase Cre peut egalement 
induire une translocation entre deux chromosomes a condition qu'un site 
loxP soit present sur chacun d'eux (37) (figure 1). De maniere plus 

20 generale, la recombinase Cre est done capable d'induire la recombinaison 
entre une ou plusieurs molecules d'ADN differentcs, a condition qu'elles 
soient poneuses de sites loxP. 

De meme la recombinase FLP, unc recombinase de 43 KDa de 
Saccharomvces cerevisiae. est capable du meme type d'action sur les 

25 fragments d'ADN contenant des sites de reconnaissance FRT (34). 

En realisant une proteine de fusion (chimere) entre la recombinase 
Cre et la region C-terminale du recepteur humain des oestrogenes 
contenant une Valine en position 400, on obtient une molecule capable 
d'exciser, en presence du Iigand du recepteur, Poestradiol, les sequences 

30 d'ADN localisees entre deux sites loxP, ainsi qu'un des sites loxP, lorsque 
ceux-ci sont en repetition directe, alors qu'en absence de ligand, Pexcision 
n'a pas lieu (28). 
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L'activite de la recombinase FLP est egalement regulable, en 
realisant des chimeres entre la FLP et le domaine de liaison de recepteurs 
nucleaires. En fusionnam la FLP avec le LBD du recepteur des oestrogenes 
ou du recepteur des glucocorticoides en I'absence de ligand, l'activite 
5 recombinase est tres faible, alors qu'elle est rapidement induite par les 
ligands respectifs des LBD (29). 

Toutefois, l'utilisation de proteines de fusion entre des recombinases 
et des LBD de recepteurs nucleaires pour exciser de facon controlee des 
fragments d'ADN situes entre des sites de reconnaissance desdites 
10 recombinases peut poser probleme, etant donn£ que les concentrations de 
ligand presentes chez l'animal ou dans les milieux de culture des cellules 
peuvent etre suffisantes pour induire au moins partiellement, l'activite 
recombinase. 

La presente invention fournit un systeme de recombinaison 

15 inductible chez les animaux, notamment les mammiferes, grace a 
l'utilisation d'une proteine de fusion realisee entre une recombinase, et le 
domaine de liaison du ligand, derive du recepteur des glucocorticoides, 
dont l'activite est inductible par des glucocorticoides synthetiques, mais 
pas par des glucocorticoides naturels notamment a des concentrations 

20 inferieures a 10-6 M c'est-a-dire physiologiques. 

Pour eviter 1'induction de l'activite recombinase de la proteine 
chimere par les ligands endogenes, la presente invention se propose de 
fournir en effet une mutation dans le LBD du recepteur des 
glucocorticoides lui permettant d'etre plus fortement active en presence 

23 de ligands glucocorticoides synthethiques, qu'en presence de ligands 
glucocorticoides naturels aux concentrations physiologiques . 

La presente invention a en effet pour objet un recepteur nucleaire 
des glucocorticoides modifie, notamment mute dans la region du domaine 
de liaison du ligand, de sorte que l'activite dudit recepteur est inductible 

30 plus fortement par un ligand glucocorticoide synthetique que par un 
ligand glucocorticoide naturel. 

Selon la presente invention on entend par "recepteur (mute) des 
glucocorticoides inductible plus fortement par un ligand glucocorticoide 
synthetique que par un ligand glucocorticoide naturel" que l'activite du 
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recepteur mute selon l'invention est induite plus fonement par des 
ligands glucocorticoides synthetiques que par des ligands glucocorticoid es 
naturels a une concentration donnee et que le recepteur mute des 
glucocorticoides selon Pinvention est beaucoup moins sensible aux 
glucocorticoides naturels que le recepteur sauvage. 

Par "activite dudit recepteur" on entend ici Pactivite 
transcriptionnelle dudit recepteur et/ou le cas ech6ant Pactivite de 
regulation de Pactivit6 d'une proteine fusionnee audit recepteur ou audit 
domaine de liaison du ligand, induite en presence de glucocorticoides. On 
cite plus particulierement Pactivite d'une proteine recombinase 
fusionnee audit recepteur ou audit domaine de liaison du ligand dudit 
recepteur. 

Par "glucocorticoides naturels", on entend ici des hormones 
steroides secretees par le cortex des glandes surrenales telles que le 
Cortisol, la corticosterone, ou Paldosterone. Par "glucocorticoides 
synthetiques", on entend des agonistes de synthese chimique dudit 
recepteur pour Pactivite concernee. On cite parmi ceux-ci, la 
dexamethasone, le triamcinolone acetonide, le RU 486, le RU 28362, le 
bimedrazol, le fluocinolone acetonide. 

Certains ligands synthetiques seront agonistes pour induire unedite 
activite particuliere du recepteur et antagonistes par rapport a une autre 
activite du recepteur. Ainsi, le compose RU 486 induit Pactivite d'une 
proteine recombinase fusionnee audit recepteur ou audit domaine de 
liaison du ligand du recepteur mais n'induit pas Pactivite 
transcriptionnelle du recepteur. 

Le ligand glucocorticoid synthethique pcut se licr au recepteur 
nucleaire sauvage (non mute), mais il se peut que ledit ligand synthetique 
se lie au recepteur mute et pas au recepteur naturel. II se peut aussi que si 
ledit ligand synthetique se lie au recepteur sauvage, Pactivite de celui-ci 
ne soit neanmoins pas induite par liaison au ligand synthetique. 

On a en particulier, identifie une mutation dans le domaine LBD des 
recepteurs nucleaires des glucocorticoides (isoleucine — > threonine) 
situee entre les helices Hll et H12 (19). Cette mutation entraine une perte 
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d'activite du recepteur en presence de glucocorticoides naturels. Plus 
precisement, ce recepteur des glucocorticoides mute entre Hll et H12 n'a 
pas ou tres peu d'activite transcriptionnelle en presence de 
glucocorticoides naturels aux concentrations physiologiques naturelles de 
ceux-ci notamment des concentrations inferieures a 10*6 M. Son activite 
peut cependant etre induite par des Hgands glucocorticoides synthetiques, 
notamment la dexamethasone (dex). 

La presente invention a plus particulierement pour objet un 
recepteur humain mute appele hGR (I747/T) caracterise en ce qu'il a pour 
sequence, la sequence en acides amines du recepteur nucleaire humain 
des glucocorticoides sauvage avec une mutation isoleucine — > threonine 
en position 747, et plus particulierement encore un recepteur nucleaire 
humain modifie qui a pour sequence en acides amines, une sequence 
substantiellement telle que representee dans l'IDS n° 1. 

La mutation de Tisoleucine 747 en threonine dans la partie C- 
terminale du domaine de liaison du ligand (LBD) du recepteur des 
glucocorticoides altere la capacite des ligands naturels a en induire 
Tactivit£ de transactivation. Les glucocorticoides naturels tels que le 
Cortisol, l'aldosterone ou la corticosterone sont tres faiblement actifs ou 
totalement inactifs avec le mutant GR (I747/T), tandis que des 
glucocorticoides synthetiques tels que la dexamethasone (Dex) stimulent 
efficacement la transactivation mediee par GR (I747/T). Toutefois, la 
courbe correspondante de reponse en fonction de la dose de ligand, pour la 
transactivation induite par Dex, est decalee vers les plus fortes 
concentrations, par comparaison avec celle obtenue avec le GR de type 
sauvage (TS). Ni le decalage, ni Pinaptitude du Cortisol a activer 
efficacement GR (I747/T) ne sont dus a une affinite alterce de liaison au 
ligand in vitro. 

En effet, la mutation dans le LBD de GR (I747/T) n'alterc pas 
sensiblement Taffinite de liaison au ligand in vitro. Toutefois, ce mutant 
presente un important decalage par rapport au GR TS de la courbe 
d'activite vers les fortes concentrations de Jigands. Aussi des 
concentrations dites physiologiques de ligands glucocorticoides naturels 
suffisantes pour activer le GR TS, n'entrainent qu'une activite residuelle 
ou nulle chez le GR mutant. 
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Ce mutant differe des autres mutants de LBD de GR decrits 
precedemment (22, 38), dont la fonction d'activation alteree est en etroite 
correlation avec une modification de leurs proprietes de liaison au ligand 
in vitro. 

La presente invention a aussi pour objet un domaine de liaison du 
ligand du recepteur nucleaire de glucocorticoids selon I'invention et 
particulierement, le domaine LBD [GR(I747/T)J caracterise en ce qu'il a 
une mutation isoleucine --> threonine entre Ies helices Hll et H12. Plus 
particulierement il a pour sequence, la sequence en acides amines du 
domaine de liaison du ligand du recepteur des glucocorticoides humain 
substantiellement telle que representee dans 1'IDS n° 1 de Tacide amine 
532 a Tacide amine 777 avec une mutation isoleucine --> threonine en 
position 747. 

La presente invention fournit egalement un fragment d'ADN codant 
pour un recepteur nucleaire de glucocorticoides modifie, notamment mute 
dans la region du domaine de liaison du ligand (LBD) selon I'invention, 
ainsi qu'un fragment d'ADN codant pour un domaine de liaison du ligand 
(LBD) du recepteur modifie selon I'invention. 

La presente invention a done plus precisement pour objet un 
fragment d'ADN codant pour un recepteur nucleaire des glucocorticoides 
sauvage avec une mutation de l'isoleucine en threonine situee entre les 
helices Hll et H12 de la sequence d'acides amines dudit recepteur, et plus 
particulierement encore un fragment d'ADN caracterise en ce qu'il a pour 
sequence, une sequence codante du recepteur nucleaire humain des 
glucocorticoides dont la sequence en acides amines est substantiellement 
telle que representee dans 1'IDS n°l. 

Dans un mode de realisation, la presente invention a pour objet un 
fragment d'ADN, caracterise en ce qu'il a pour sequence, la sequence de 
l'ADNc du recepteur nucleaire humain des glucocorticoides 
substantiellement telle que representee dans TIDS n° 1 comportant lc 
codon ACC codant pour la threonine en position 747 dc la sequence d'acides 
amines dudit recepteur. 
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De meme la presente invention a pour objet un fragment d'ADN 
codant pour le domaine de liaison du ligand (LBD) du recepteur nucleaire 
des glucocorticoides modifie avec une mutation isoleucine — > threonine 
situ£e entre les helices Hll et HI 2 et notamment en position correspondant 
a la position 747 de la sequence en acides amines du recepteur nucleaire 
humain des glucocorticoides. 

Plus particulierement, la presente invention fournit un fragment 
d'ADN codant pour le domaine de liaison du ligand du recepteur nucleaire 
humain des glucocorticoides modifie, caracterise en ce qu'il a pour 
sequence, une sequence codant pour les acides amines du domaine de 
liaison du ligand du recepteur nucleaire humain des glucocorticoides dont 
la sequence en acides amines est substantiellement telle que representee 
dans l'IDS n° 1 de l'acide amin£ 532 a l'acide amine 777. 

Plus particulierement encore, la presente invention fournit un 
fragment d'ADN, caracterise en ce qu'il a pour sequence, la sequence 
d'ADNc codant pour le domaine de liaison du ligand (LBD) du recepteur 
nucleaire humain des glucocorticoides substantiellement telle que 
representee dans l'IDS n° 1 du codon 532 au codon 777 avec le codon ACC en 
position 747. 

La presente invention a en outre pour objet un systeme vectoriel 
depression conditionnelle d'une proteine notamment une proteine 
etrangere dans des cellules hotes comportant un element de controle de la 
transcription inductible par un complexe forme par un recepteur 
nucleaire des glucocorticoides et un ligand, caracterise en ce qu'il 
comprend : 

- un premier fragment d'ADN consistant en un fragment d'ADN 
codant pour ladite proteine sous le controle d'elements assurant son 
expression dans lesdites cellules hotes, lesdits elements assurant son 
expression comprenant une sequence de controle de transcription 
(RE) inductible par le recepteur selon l'invention complexe a un 
ligand glucocorticoid synthetique, et 
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- un deuxieme fragment d'ADN consistant en un fragment d'ADN 
fonctionnel codant pour ledit recepteur selon l'invention ou 
seulement une partie dudit fragment comprenant la region qui 
reconnait le ligand (LBD) selon l'invention, et la region de liaison a 

5 l'ADN (DBD) qui se fixe sur ladite sequence de controle de la 

transcription (RE). 

- lesdits premier et deuxieme fragments d'ADN pouvant etre portes 
par un meme vecteur ou deux vecteurs separement. 

Dans un mode de realisation, le systeme vectoriel comporte I'ADNc 
10 codant pour : 

- la region LBD, representee par des codons codant les acides amines 
n° 532 a 777 dans 1'IDS n° 1, et 

- la region DBD, representee par des codons codant les acides amines 
n° 421 a 487 dans 1'IDS n° 1. 

15 Certaines cellules ont du GR endogene qui peut etre active par des 

ligands naturels et des ligands synthetiques. Si on veut activer un gene 
donne a volont£ dans de telle cellules, sans qu'il puisse etre active par les 
ligands endogenes ni par les recepteurs endogenes, il faut que ce gene 
contienne un RE different du GRE et utiliser un activateur chimerique 

20 comportant le DBD correspondant et un LBD mute selon Tinvention. Ce 
gene pourra done etre active par des ligands synthetiques, mais non par 
des ligands naturels. 

C'est pourquoi dans un mode de realisation, on remplace le domaine 
de liaison a l'ADN (DBD) du recepteur des glucocorticoides par celui d'un 

25 autre transactivateur, notamment celui de la proteine de levure Gal 4 et on 
remplace la sequence de controle de transcription (RE) du recepteur des 
glucocorticoids par celle d'un autre transactivateur, notamment la 
sequence 17 mere (17m) reconnue par la proteine Gal4. 

La presente invention a done egalement pour objet un proc£de 

30 d'expression d'une proteine etrangere dans des cellules humaines ou 
animales notamment de mammiferes, caracterise en ce que Ton cultive des 
cellules qui contiennent un systeme vectoriel d'expression selon 
Pinvention, et en ce qu'on ajoute ledit ligand synthctique, dans le milieu 
de culture, puis on recupere la proteine synthetisee. 

35 
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Les ligands glucocorticoides synthetiques diffusent librement dans 
les cellules lorsqu'ils ajoutes dans le milieu de culture ou injectes dans un 
animal. 

Dans ce procede on utilisera en particulier un ligand synthetique 
5 choisi parmi la dexamethasone, 1c triamcinolone acetonide, le RU2836, le 
bimetrazole, le deacylcortivazol et le fluocinolone acetonide. 

La presente invention a en outre pour objet une proteine de fusion 
comprenant un recepteur selon Pinvention ou un domaine de liaison du 
ligand selon Pinvention et une proteine dont Pactivite est inductible plus 
10 fortement par liaison dudit recepteur ou dudit domaine de liaison du ligand 
(LBD) dudit recepteur avec undit ligand glucocorticoide synthetique 
qu'avec un ligand glucocorticoide naturel. 

En particulier, la presente invention a pour objet une proteine de 
fusion qui comprend une proteine recombinase et plus particulierement 
15 de la famille des integrases X et plus particulierement encore, la proteine 
Cre du bacteriophage Pi- 

Dans un mode de realisation, la proteine de fusion comporte la 
partie C-terminale de la region charniere D du recepteur nucleaire 
humain des glucocorticoides, intercalee entre la proteine Cre et ledit 
20 domaine de liaison du ligand du recepteur modifie selon l'invention. 

L'activite recombinase proprement dite de la proteine de fusion est 
similaire a celle de Cre. Elle permet done, comme Cre, d'exciser ou 
d'inverser des sequences d'ADN localisees entre des sites loxP, d'inserer un 
plasmide contenant un site loxP au niveau d'un site loxP localise dans le 
25 genome, ou d'effectuer une translocation entre deux chromosomes 
contenant chacun un site loxP. 

La presente invention a egalement pour objet un gene de fusion 
codant pour la proteine de fusion selon Pinvention comprenant un 
fragment d'ADN codant pour un recepteur nucleaire de glucocorticoides 
30 modifie ou un domaine de liaison du ligand dudit recepteur selon 
Pinvention, ainsi qu'un fragment d'ADN codant pour une proteine dont on 
veut reguler Pactivite, ladite activite etant inductible par liaison dudit 
recepteur ou dudit domaine de liaison du ligand avec undit ligand 
glucocorticoide synthetique mais pas par liaison avec un ligand 
35 glucocorticoide naturel lorsque ladite proteine se trouve fusionnee audit 
recepteur ou audit domaine de liaison du ligand dudit recepteur. 
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Plus particulierement la presente invention a pour objet un gene dc 
fusion comprenant dans le sens 5* — > 3* : 

- un fragment d'ADN codant pour la recombinase Cre du 
bacteriophage Pi ; 

S - un fragment d'ADN codant pour tout ou partie de la region 

charniere D du recepteur nucleaire des glucocorticoides, region 
situee entre le domaine DBD et le domaine LBD, et 

- le fragment d'ADN codant pour le domaine de liaison du ligand 
(LBD) modifie, notamment mute, du recepteur nucleaire des 

10 glucocorticoides selon Pinvention. 

Et plus particulierement encore, la presente invention a pour objet, 
un gene de fusion, caracterise en ce qu'il a pour sequence , une sequence 
codant pour la sequence d'acides amines de PIDS n° 2 comprenant : 

- les acides amines 1 a 343 qui correspondent a la recombinaison 
15 Cre ; 

- les acides amines 346 a 377 qui correspondent a la region C- 
terminale de la region D du recepteur humain des glucocorticoides ; 

- les acides amines 378 a 623 qui correspondent au LBD [GR(I747/T)J. 
Dans un mode de realisation particulier, le gene de fusion a 

20 substantiellement pour sequence, la sequence Cre-LBD[GR(1747/T)] telle 
que representee dans PIDS n° 2 dont les acides amines 626 a 667 
correspondent a la region F du recepteur humain des oestrogenes. 

La presente invention a egalement pour objet un vecteur 
d'expression de la proteine de fusion codec par le gene de fusion selon 

25 Pinvention, dans des cellules hotes animales notamment de mammiferes, 
caracterise en ce qu'il comporte le gene de fusion selon Pinvention, plac6 
sous le controle d'elements depression assurant son expression dans 
lesdites cellules hotes. Le vecteur d'expression de la proteine de fusion 
peut egalement etre un vecteur d'integration dans le genome des cellules 

30 hotes. 

Dans les vecteurs selon Pinvention, pour exprimer 1c recepteur, le 
LBD ou la proteine de fusion selon Pinvention, il faut que les fragments 
d'ADN codant pour ces molecules soient placees sous le controle de 
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sequence de regulation, notamment des sequences promotrices/ enhancer. 
On peut utiliser en particulier des sequences promotrices/enhancer du 
virus SV 4 q. 

La presente invention a en outre pour objet un proc£d6 de 
5 recombinaison, notamment decision, insertion, inversion ou 
translocation conditionnelle au niveau d'un fragment d'ADN contenant un 
ou deux sites de reconnaissance sp£cifique d'une proteine recombinase 
dans des cellules h6tes humaines ou animales, notamment de mammiferes, 
caracterise en ce qu'il comporte les etapes dans lesquelles : 
10 1) on introduit une proteine de fusion selon Tinvention ou un 

vecteur d'expression de ladite proteine de fusion selon l'invention 
dans lesdites cellules hotes dans des conditions permettant 
l'expression de la proteine de fusion selon l'invention et, 
2) on complexe ladite proteine de fusion avec undit ligand 
15 glucoconicoide synthetique, en mettant ledit ligand en presence 

desdites cellules hotes. 

La presente invention fournit done un precede de deletion 
conditionnelle d'un fragment d'ADN dans lequel on met en oeuvre un 
procede d'excision selon l'invention, et dans lequel ledit fragment d'ADN a 

20 exciser est integre entre deux sites de reconnaissance de proteine 
recombinase orientes en repetition directe. En particulier, ledit fragment 
d'ADN peut etre choisi de telle sorte que ('excision dudit fragment d'ADN a 
pour effet, Pinactivation dudit gene. L'excision dudit fragment d'ADN peut 
egalement permettre la synthese d'une proteine fonctionnelle, si ledit 

25 fragment contient par exemple un codon stop ou un signal de 
polyadenylation. 

Dans le mode prefere de realisation selon l'invention, lesdits sites de 
reconnaissance specifique de la proteine recombinase sont les sites loxP et 
ladite proteine recombinase est la proteine Cre du bacteriophage P x . 

30 Ledit fragment d'ADN que Ton veut recombiner, notamment exciser 

et le ou lesdits sites de reconnaissance specifiques d'une proteine 
recombinase peuvent etre portcs par un vecteur plasmidique ou viral, ou 
integres dans le chromosome des cellules hotes. 
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L'integration d'un gene ponant des sites loxP dans un genome peut 
etre aleatoire ou ciblee, En particulier, Pintegration des sites de 
reconnaissance sp£cifique de la proteine recombinase, notamment du ou 
des sites loxP pour la recombinase Cre, peut se faire par recombinaison 
homologue du gene comportant ledit fragment d'ADN a exciser ou inverser 
(2 sites loxP) ou respectivement inserer ou transloquer (1 site loxP) avec 
undit gene modifie comportant ledit fragment d'ADN a exciser flanque en 
5* et/ou 3' par le ou lesdits sites de reconnaissance de recombinase en 
fonction de Papplication desiree, notamment les sites loxP. 

On a construit une proteine chim^rique, Cre-LBD[GR(1747/T)] de 
TIDS n° 2, composee de la recombinase Cre fusionnee au LBD de GR 
(I747/T). La proteine de fusion Cre-LBD[GR(I747/T)] permet de realiser une 
recombinaison entre des sites loxP, dans une cellule de mammifere, suite a 
un traitement par des glucocorticoides synthetiques. En l'absence de 
traitement, ou en presence de concentrations de glucocorticoides naturels 
allant jusqu'a lO 6 M aucune excision n'est observee. Cette chimere est 
capable d'exciser les sequences d'ADN situees entre des sites loxP integres 
prealablement dans le genome de cellules F9 (embryocarcinome de souris) 
ou presents sur un plasmide apr£s transfection de ces cellules avec un 
vecteur exprimant Cre-LBD[GR(I747/T)], suite a un traitement i la Dex a 10* 
6 M ou 10" 7 M, alors qu'a de telles concentrations, le Cortisol n'induit pas 
d'activite recombinase. Comme on Pa dej& mentionnd, le vecteur 
d'expression de Cre-LBD[GR(I747/T)] peut egalement etre un vecteur 
d'integration dans le genome des cellules hotes. 

Ce systeme permet done de liberer l'activite recombinase de 
proteine chimerique a un moment donne et choisi. La proteine de fusion 
Cre-LBD[GR(I747/T)] peut etre exprimee dans des cellules contenant des 
sites loxP, sans modifier le locus contenant les sites loxP. La recombinaison 
au niveau des sites loxP a lieu uniquement apres traitement aux 
glucocorticoides synthetiques. De plus en exprimant la proteine de fusion 
Cre-LBD[GR(I747/T)] dans un animal sous le controle d'un promoteur a 
specificite cellulaire, on peut obtenir une recombinaison entre des sites 
loxP, specifiquement dans ces cellules. 
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La presente invention a egalernent pour objel un vecteur de 
transfert d'un fragment d'ADN dans des cellules hotes humaines ou 
animates, notamment mammiferes, caracterise en ce qu'il comporte undit 
fragment d'ADN a transferer comprenant des sites de reconnaissance 
5 specifiques de la recombinase, notamment deux sites loxP, orientes a 
repetitions directe et une cassette d'expression d'un gene de fusion selon 
Pinvention. De facon appropri£e les deux sites sont places a chaque 
extremite dudit fragment d'ADN. 

De preference, le gene de fusion est place sous le controle 
10 d'elemems d'expression specifiques des cellules hotes, cn particulier, il 
comporte la sequence du piasmide pCre-LBD[GR(I747/T)] de PIDS n° 3. 

Dans le precede d'excision selon Pinvention, ledit fragment d'ADN & 
exciser peut etre transfere dans les cellules hotes avant, en meme temps, 
ou apres Petape d'introduction de la proteine de fusion ou d'un vecteur de 
15 transfert. 

Le vecteur de transfert selon Pinvention peut etre, un vecteur 
plasmidique ou un vecteur viral. Le mode de transfert varie en fonction du 
type de cellule cible et de Pefficacite recherchee. 

Lorsque le materiel est transfere dans les cellules germinales, on 
20 utilise de preference la microinjection du pronucleus male d'un ovocyte 
feconde. Pour introduire PADN dans des cellules embryonnaires 
pluripotentes (cellules ES), la technique appropriec sera plutot 
Pelectroporation ou Putilisation de vecteurs retroviraux 

Pour des experiences portant sur les cellules somatiques, on 
25 cherche a obtenir une efficacite maximale, d'ou Putilisation 
preferentielle de vecteurs viraux : retrovirus et adenovirus, 
principalement. Ces virus doivent etre defectifs, notamment pour une 
application en sante humaine pour empecher toute multiplication et tout 
risque de revertion. 

30 Apres integration ou non de ce type de vecteurs dans le genome, le 

systeme Cre-lox permet d'exciser certaines sequences virales, qui 
pourraient eventuellement presenter un risque quant a la propagation 
ulterieure du virus. Ceci est tres avantageux pour Putilisation de tels 
vecteurs en therapie genique. Des vecteurs conienant une cassette 
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d 'expression du gene Cre-LBD[GR(I747/T)] et des sites lox encadrant un 
g£ne potentiellement "dangereux" et cette cassette permettent, le cas 
echeant apres integration dans le genome du virus recombine, d'eliminer 
ces elements. Inversement, on peut egalement activer un gene que Ton a 
5 integr6 sous forme inactive. Cette activation peut resulter de la deletion 
d'un fragment dudit gene par exemple un codon stop ou un signal de 
polyadenylation encadre de sites loxP. 

Lorsque Ton veut transferer du materiel gen^tique dans une 
cellule, on utilise en general des constructions comportant le gene a 

10 transferer, auquel on a adjoint eventuellement un gene auxiliaire, 
conferant un avantage selectif (par exemple, le gene neo, conferant la 
resistance a Pantibiotique G418). 

Les marqueurs de selection peuvent egalement etre excises par le 
procede d'excision selon 1'invention. 

15 En utilisant des techniques classiques, on peut modifier par 

recombinaison homologue des genes de mamrniferes, notamment de souris. 
Un site loxP peut etre introduit dans un gene qu'on veut modifier, ou deux 
sites loxP peuvent encadrer des sequences que Ton veut modifier. En 
particulier, le marqueur de selection utilise pour permettre d'identifier les 

20 evenements de recombinaison homologue peut etre genant, et peut dans 
un premier temps etre elimine, si necessaire, s'il est lui meme encadre de 
sites de reconnaissance de recombinase tels que des sites loxP ou FRT, en 
microinjectant la proteine recombinase correspondante, en transfectant 
les cellules, notamment des cellules ES, avec un vecteur d'expression pour 

25 une proteine recombinase, ou en croisant des souris portant le marqueur 
de selection avec des souris exprimant la recombinase desiree, notamment 
la recombinase Cre. Ceci permet d'obtenir des souris dont la seule 
modification au niveau du locus modifie est Pinsertion de sites de 
reconnaissance tels que loxP. Ces souris peuvent par la suite etre croisees 

30 avec des souris exprimant Cre-LBD[GR(I747/T)] et la modification du locus 
obtenue par traitement avec le ligand tel que la Dex. Ceci permet 
d'inactiver ou de modifier un gene a un moment determine, et done 
d'etudier la fonction de ces genes a differents moments du developpement. 
Ceci est particulierement interessant pour Petude des genes qui sont 
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indispcnsables au bon deroulement du developpement embryonnaire. En 
effet, dans certains cas, Ies techniques classiques de recombinaison 
homologue entrainent la mort de I'embryon et ne permettent pas d'etudier 
la fonction du gene a des stades plus tardifs. 
5 Le transfer! de genes dans une cellule donnee est a la base de la 

therapie genique. Les vecteurs les plus efficaces a cet egard sont des 
vecteurs viraux, en particulier retroviraux ou adenoviraux (39). La 
presente invention a done egalement pour objet un vecteur de transfert 
selon i'invention comportant ledit fragment d'ADN a transferer 

10 comportant deux sites loxP orientes en repetition directe pour une 
utilisation comme medicament en therapie genique, lorsque celui-ci est 
administre en combinaison avec undit ligand glucocorticoide synthetique 
tel que la dexam£thasone. 

Ce type de vecteur permet de transferer 1c fragment d'ADN desire 

15 comportant deux sites de reconnaissance specifique de recombinase dans 
un gene de sorte que les sequences d'ADN situees entre les deux sites IoxP 
pourront etre excisees de facon conditionnelle apres administration dudit 
ligand glucocorticoide synthetique. 

La presente invention fournit en outre des cellules humaines ou 

20 animales notamment de mammiferes, transferees par un vecteur 
d'expression et de transfert d'une proteine de fusion selon Tinvention, ou 
des cellules humaines ou animales notamment de mammiferes, dans 
lesquelles un fragment d'ADN a ete transfere a l'aide d'un vecteur de 
transfert selon Tinvention, ou encore des cellules humaines ou animales, 

25 notamment de mammiferes exprimant de facon constitutive la proteine de 
fusion selon Tinvention. 

La presente invention a enfin pour objet supplementaire, un 
animal transgenique, notamment une souris comportant un gene 
fonctionnel de la proteine de fusion selon Pinvention, celui-ci etant 

30 notamment integre dans un de ses chromosomes. 

Ou encore un animal transgenique comportant un gene fonctionnel 
de la proteine de fusion selon l'invention, dans lequel un gene d'interet 
est modifie par insertion de site(s) loxP, notamment integre(s) dans un ou 
plusieurs chromosomes. 
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La presente invention a enfin pour objet l'utilisation d'un vecteur 
d'expression ou de transfert de cellules ou d'un animal selon l'invention 
comme outil d'analyse ou d'etude du fonctionnement d'un gene donne 
d'une cellule hote et une methode de traitement de cellules ex vivo ou in 
vitro impliquant la rnise en oeuvre d'un precede d'excision, insertion, 
inversion ou translocation selon l'invention et l'utilisation d'un vecteur 
d'expression ou de transfert selon Tinvention. 

D'autres caract£ristiques et avantages de la presente invention 
apparaitront & la lumiere de la description detaillee qui va suivre. 

L'IDS n° 1 represente les sequences nucleotidique et peptidique de 
de GR(I747/T) avec le DBD correspondant aux aa 421-487 et le LBD 
correspondant aux aa 532-777; 

L'IDS n° 2 represente les sequences nucleotidique et peptidique de 
Cre-LBD[GR(I747/T)] 

Les nucleotides 1-1029 codent pour la recombinase Cre (aa 1-343). 

Les nucleotides 1036-1131 codent pour la region C-terminale de la 
region D du recepteur humain des glucocorticoides [aa 500-531 de 
GR(I747/T) ; aa 346-377 de Cre-LBD[GR(I747/T)]. 

Les nucleotides 1 132-1869 codent pour le LBD de GR(I747/T) [aa 532- 
777 de GR(I747/T) ; aa 378-623 de Cre-LBD[GR(I747/T)]. 

Les nucleotides 1876-2001 codent pour la region F du recepteur 
humain des oestrogenes [aa 554-595 de HEG0 ; aa 626-667 de Cre- 
LBD[GR(I747/T)]. 

Les nucleotides 1777-1779 correspondent a la mutation qui remplace 
1'isoleucine par une threonine. 

L'IDS n° 3 represente la sequence nucleotidique du plasmide pCre- 
LBD[GR(I747/T)] 

Les IDS n° 4 a 17 representent les sequences nucleotidiques des 
differents oligonucleotides utilises selon l'invention. 

La Figure 1 est une representation schematique d'activites 
recombinases de Cre. 

La Figure 2 represente 1'activite transcriptionnelle de recepteur GR 
mutant et de type sauvage en reponse a la dexamethasone et la capacite de 
fixation de la dexamethasone aux deux reccpteurs. 
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La Figure 3 represente une analyse de Scatchard de la liaison de 
[3H]-dexamethasone aux recepteurs de type sauvage et mutant I747/T. 

La Figure 4 represente la competition par RU 486 des aciivites de 
liaison de Dex et de transactivation du recepteur de type sauvage (TS) et 
5 GR(I747/T). 

La Figure 5 est une representation schematique des proteines Cre, 
hER, Cre-ER, hGR et Cre-LBD[GR(I747/T)]. 

La Figure 6 est une representation schematique du plasmide pCre- 
LBD[GR(I747/T)]. 

10 La Figure 7 represente la sequence nucleotidique de pCre- 

LBD[GR(I747/T)] et la sequence peptidique de Cre-LBD[GR(1747/T)]. 

La Figure 8 rcprdsente la strategie PCR utilis^e pour detecter les 
alleles sauvages, mut£s et recombines dans le test d'activite recombinase 
de Cre-LBD[GR(I747/T)]. 
15 La Figure 9 represente I'analyse par PCR de Pexcision des sequences 

situees entre les sites loxP apres transfection transitoire de pCre- 
LBD[GR(I747/T)] dans les cellules murines RXRa+/-(LNU sans ajout de 
ligand, ou traitees au Cortisol (10-6 M) ou a la dexamethasone (10-& M). 

La Figure 10 represente 1'analyse par PCR de l'activite recombinase 
20 de Cre-GR(I747/T) dans les cellules RXRa+'-d-NU : Cre-GR(1747/T) non 
traitees ou traitees avec du Cortisol ou de la dexamethasone a 1CKNL 

La Figure 1 1 recapitule Tactivite recombinase de Cre- 
LBD[GR(I747/T)] dans la lignee RXRa +/ -(LNU exprimant la recombinase de 
fac;on constitutive, en presence de concentrations croissantes de 
25 differents ligands. 

La Figure 12 represente I'analyse par PCR de 1'activiie recombinase 
de Cre-LBD[GR(I747/T)] induite par des ligands synthetiques malgre la 
presence de ligands naturels. 

La Figure 13 represente le test de I'activite recombinase de Cre- 
30 LBD[GR(I747/T)] dans les cellules humaines HeLa. 

La Figure 14 est une representation schematique du trangene Cre- 
LBD[GR(I747/T)]. La partie (a) represente le fragment d'ADN contenant la 
sequence codante du gene Cre-LBD[GR(I747/T)] utilise pour etablir des 
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souris transg£niques et la partie (b) represente la structure genomique de 
l'allele RXRa de type sauvage, de l'allele cible RXRaAAF2<LNL) e t de l'allele 
excise RXRa A < A F2(U ainsi que la strategic PCR pour l'analyse de 1 'excision 
du niarqueur. 

La Figure 15 represente l'analyse par PCR de Pactivite recombinase 
de Cre-LBD[GR(I747/T)] chez la souris traitee a la dexamethasone. 

EXEMPLE 1 : Remplacement de Pisoleucine 747 par la threonine 
dans le recepteur nucleaire humain des glucocorticoides. 

On a obtenu un mutant GR humain comportant un seul 
remplacement d'acide amine, celui du residu isolcucine 747 par un residu 
threonine, localise entre les helices Hll et HI 2, dans la partie C- terminate 
du domaine de liaison du ligand. Cette mutation est apparue spontanement 
dans les vecteurs derives de HG1 (40). Ce mutant differe des autres mutants 
de LBD de GR d<krits precedemment (22, 38), dont la fonction d'activation 
alteree est en etroite correlation avec une modification de leurs proprietes 
de liaison du ligand in vitro. 

1. Mutation dans le GR humain 

Le vecteur d'expression du GR humain de type sauvage (pSG5HG0) a 
ete obtenu en clonant le fragment BamHl d'environ 2.9 kb (contenant le 
cadre de lecture ouvert du hGR de type sauvage) isole du vecteur HGO 
precedemment decrit (40), dans le site BamHI du vecteur d'expression 
pSG5 (41). 

Toutes les constructions d'ADN ont ete effectuees au moyen de 
techniques classiques (42). Le vecteur d'expression GR (I747/T)hGR codant 
pour un mutant portant la mutation I 747->T, a ete obtenu a partir du 
fragment de digestion Pstl-PflMI du vecteur d'expression HG1 (40) mute 
qui etait ligature dans les sites Pstl et PflMI correspondants de pSGSHGO. 

En plus de la mutation du residu isoleucine 747 en un residu 
threonine presente dans HG1, ce mutant contient egalement une mutation 
du site EcoRI qui n'entraine pas d'alteration de la sequence peptidique. 

La presence de la mutation a ete confirmee par sequencage 
(protocole Sequenase 2.0, U.S. Biochemical Corp., Cleveland, HO). 
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2. Resultats 

2.1. Le remplacement de 1'isoleucine 747 par la threonine conduit a 
un decalage de la courbe de reponse en fonction de la dose de 
dexamethasone pour la transactivation, sans affecter sensiblement 
l'affinite de liaison du ligand. 

On a compare les caracteristiques transcriptionnelles du hGR de 
type sauvage (TS) et d'un mutant dans lequel 1'isoleucine 747 a ete 
remplac£e par la threonine [designe ci-apres par GR(I747/T)]. Les 
recepteurs ont ete exprimes transitoirement dans des cellules CV-1 
exemptes de GR, conjointement avec un gene reporter de luciferase sous le 
controle du promoteur de 1'aminotransferase de la tyrosine (pTAT-tk-Luc). 
La Figure 2 montre les courbes correspondantes de reponse en fonction de 
la dose de ligand utilisee, permettant de determiner les valeurs de la CE50 
(la concentration de ligand donnant 50 % de la reponse transcriptionnelle 
maximale). La courbe de reponse en fonction de la dose pour hGR TS 
presente une reponse maximale a 10-8 M de Dex et une reponse egale a la 
moitte de la reponse maximale a 4x10" 10 M, alors que la courbe de reponse 
transcriptionnelle du mutant GR(I747/T) est nettement decalee vers les 
plus fortes concentrations de ligand, entrainant des valeurs 100 fois plus 
elevees de la CE 50 pour Dex (4x10-8 M) (voir tableau 1 ci-apres). La 
stimulation maximale mediee par GR(I747/T) a ete atteinte a environ 
10-6 M Dex. Toutefois, il est important de noter que le reccpteur GR(I747/T) 
est capable d'activer la transcription du pTAT-tk-Luc au meme degre que le 
GR TS. En consequence, le remplacement du residu isoleucine par la 
threonine a la position 747 ne diminue pas l'aptitude du GR a activer la 
transcription mais a modifie specifiquement la sensibilite au ligand de la 
reponse. 

L'effet de cette mutation est independant de la region A/B 
N-terminale et de sa fonction de transactivation associee AF-1. Les mutants 
de delation depourvus de AF-1 mais contenant la mutation I747/T[AA/B- 
GR(I747/T)] necessitent 3x10-8 M de Dex pour une stimulation 
representant la moitie de la stimulation maximale, tandis que seulement 
6x10*10 m sont suffisants pour le AA/B-GR derive de TS (donnees non 
representees; voir egalement le tableau II pour les chimeres GAL 
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correspondantes). Ainsi, la mutation 1747/T exerce un effet similaire sur le 
GR complet et le GR a deletion N-terminale. On peut en conclure que le 
decalage observe dans la reponse en fonction de la dose de ligand n'est pas 
la consequence d'une interaction modifiee entre AF-1 et AF-2. 
5 Pour determiner 1'effet de la mutation 1747/T sur la liaison dU 

ligand, on a mesure la liaison de Dex dans un cytosol de cellules Cos-7 
exprimant transitoirement le hGR mutant et le hGR de type sauvage. Les 
valeurs de Kd obtenues a partir d'une analyse de Scatchard sont tres 
semblables, puisque le mutant 1747/T ne manifeste qu'une affinite pour la 

10 Dex deux fois plus faible que le GR TS (Figure 3). Ainsi, l'ordre de grandeur 
du decalage des courbes dose-reponse vers les fortes concentrations de 
hGR (1747/T), par rapport au hGR TS (environ 100 fois) est peu susceptible 
de resulter d'une diminution d'affinite pour le ligand du hGR mute 
(facteur 2 seulement ; comparer les Figures 2 et 3). 

15 2.2. hGR( 1747/T) ne repond pas aux ligands naturels 

Pour caracteriser davantage les caracteristiques de liaison du 
mutant 1747/T, on en a compare Pactivation par divers agonistes 
synthetiques connus pour le GR TS (triamcinolone acetonide, RU28362, 
bimedrazol), un agoniste partiel (fluocinolone acetonide) et des 

20 glucocorticoides naturels (Cortisol, cortico-st^rone). Avec le recepteur 
mutant, le triamcinolone acetonide et le RU28362 donnent la meme 
transactivation qu'avec le recepteur de type sauvage, tandis que le 
bimedrazol et la fluocinolone acetonide ont manifeste une plus forte 
activite (tableau I), Pour tous ces analogues, le mutant 1747/T manifeste un 

25 decalage de la courbe de reponse en fonction de la dose, en direction des 
plus fortes concentrations de ligand, bien que cc decalage soit moins 
prononce pour des ligands a forte affinite (tableau 1). 

Les ligands naturels, tels que le Cortisol ou la corticosterone ou 
Taldosterone, le ligand naturel du recepteur de mineralocorticoides, se 

30 lient au GR avec une plus faible affinite que Dex. Avec le GR de type 
sauvage, ces ligands sont aussi efficaces que la Dex pour stimuler le 
reporter de la luciferase (tableau I). Toutefois, en presence de ces ligands 
naturels, et en contraste notable avec les effets observes avec Dex, la 
transactivation par le mutant 1747/T est fortement diminuec (Cortisol) ou 

35 supprimee (corticosterone, aldosterone). 
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2.3. Activites agonistes et antagonistes similaires de RU486 avec 
hGR de type sauvage et hGR mutant 

RU486 est un puissant inhibiteur de l'expression des genes 
dependant des glucocorticoides. En presence de cet antagoniste, la fonction 
5 AF-2 de GR est bloquee, mais on a pu observer une certaine activite 
agoniste dependant de AF-1 [(43) et references qui y sont contenues]. Une 
mutation ou une deletion de la partie C-terminalc du LBD peuvent alterer 
la reponse a des ligands agonistes/antagonistes, bien que les roles de AF-1 
et de AF-2 n'aient pas ete clairement definis dans les etudes rapportees 
10 (44-46). 

Pour tester 1'affinite de liaison relative de RU486 pour le mutant 
I747/T et le type sauvage, on a examine 1'aptitude de RU486 a entrer en 
competition avec la Dex pour la liaison aux recepteurs. Des cellules 
transfectees avec hGR mutant ou TS ont ete traitees par 10 nM de PH]-Dex, 

15 une concentration suffisante pour engendrer essentiellement des 
recepteurs mutants et TS complexes avec la Dex, conformement aux essais 
de liaison de ligand in vitro (voir plus haut), et par des concentrations 
croissantes de RU486 (Figure 4) . On a obtenu des valeurs de la Clso (la 
concentration d'antagoniste bloquant 50 % de la transactivation 

20 maximale) tres similaires pour les deux recepteurs (10-8M pour le hGR TS et 
6xl0-9M pour le hGR mutant). Ces resultats sont en accord avec les essais de 
liaison a Dex et montrent que les affinites de liaison a Dex et RU486 ne sont 
pas modifiees par la mutation 1747/T. 

2.4. Le decalagc de Tactivite transcriptionnelle du recepteur 
25 mutant est independant du promoteur 

On a obtenu les resultats decrits ci-dessus dans des cellules 
transfectees, en utilisant un g£ne rapporteur contenant un fragment 
promoteur du gene TAT qui heberge deux elements de reponse aux 
glucocorticoides (GRE). Pour distinguer entre une modification des 
30 proprietes intrinseques de transactivation du recepteur et une 
modification de Tactivite cooperatrice resultant de la liaison de plusieurs 
molecules de recepteur, on a compare les activites transcriptionnelles du 
recepteur mutant GR(I747/T) et du recepteur de type sauvage, cn utilisant 
un promoteur synth^tique contenant un seul GRE, palindromique et 
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parfait. Les courbes correspondantes de reponse en fonction de la dose 
presenters les memes profils que celles obtenues avec le promoteur TAT. 
La reponse correspondant a la moitie de la reponse maximale est obtenue & 
10*10 M pour le GR TS et a 2x10-8 M pour GR{I747/T) (tableau II). Cela 
5 indique que le decalage observe avec le recepteur mutant reflete les 
proprietes de transactivation intrins^ques du mutant GR(I747/T) et ne sont 
pas le resultat d'une alteration de la cooperation entre les recepteurs. 

Le remplacement du domaine de liaison d'ADN de GR par les 147 
premiers acides amines du transactivateur de Gal4 de levure donne une 

10 proteine activatrice hybride ayant une nouvelle specificite de promoteur. 
Les hybrides Gal4-GR consistent en le domaine de liaison d'ADN (DBD) de 
Gal4 (1-147) fusionne avec le LBD de hGR TS ou mutant. Leurs aptitudes a 
activer la transcription ont ete testees dans des essais de transfection 
transitoires dans des cellules HeLa. On a constate le meme decalage qu'avec 

15 le mutant GR(I747/T) complet (tableau II). Ces r^sultats montrent que le 
decalage de la reponse transcriptionnelle en fonction de la dose du ligand 
est independant de promoteur et d'element de reponse (RE). En outre, cet 
effet est apparemment non specifique des souches de cellules utilisees, 
comme on l'a constate 4 la fois dans des cellules humaines HeLa et des 

20 cellules simiennes Cos. Pour exclure davantage une implication possible de 
facteurs se liant au promoteur tk ou ft-globine du gene rapporteur (47), on 
a utilise un gene rapporteur contenant un element de reponse Gal4 
precedant un promoteur minimal. Bien que la transactivation par la 
proteine chimerique Gal4 ait ete diminuee avec ce gene rapporteur 

25 minimal, on a encore pu observer un decalage de la courbe de reponse 
vers les doses croissantes pour la proteine chimerique mutante 
Gal4-GR(I747/T) (tableau II). 

2.5. Activite transcriptionnelle de recepteurs GR mutant et de type 
sauvage en reponse a la dexamethasone ( Figure 2). 

30 Des cellules CV-1 ont ete transitoirement transfectees avec 0,5 \xg dc 

vecteurs depression de GR de type sauvage (0) ou de GR(I747T) (o), 2,5 ng 
de pTAT-tk-Luc en tant que plasmide raporteur et 0,5 ng de pCMV-ftGal en 
tant que temoin interne. Apres la transfection, on a mis les cellules a 
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incuber pendant 24 heures avec des concentrations croissantes de Dex, et 
on les a ensuite soumises a un essai des activites R-galactosidase et 
luciferase, comme decrit dans "Materiels et Methodes". L'activitc 
luciferase a ete normalisee avec l'activite ft-galactosidase, et la valeur 
5 obtenue en absence de ligand a etc soustraite pour chaque point. Les 
resultats ont £tc exprim£s en pourcentage de Tactivite luciferase maximale 
obtenue pour chaque recepteur. Chaque point est la rnoyennc + ecart-type 
de la moyenne, de quatre determinations separees effectuees en double. 
Les analyses de liaison a saturation ont ete effectuees avec des cytosols 

10 provenant de cellules Cos-7 transfectees avec 40 \ig de vecteur d'expression 
de hGR de type sauvage (D) ou de hGR(I747/T) (•), avec 20 \xg de 
pCMV-ftGal mis a incuber pendant une nuit ^ 4°C en presence de 
concentrations croissantes de [3H]-dexamethasone + un exces de lOOx de 
Dex radio-inerte. Le steroide [3H] fixe a ete mesure apres traitcment au 

15 charbon enrobe de dextran. Les resultats representes sont ceux d f un seul 
essai effectue en double et representatif de trois essais separes. Les 
courbes de saturation de la liaison de [3H]-dexamethasone sont 
representees en pourcentage de la capacite de liaison maximale obtenue 
pour chaque recepteur. La capacite de liaison du mutant GR(I747/T) est 

20 diminuee pour atteindre environ 40-60 % de celle du hGR de type sauvage 
(623 ± 65 fmoles/mg de proteinc, par rapport a 1 340 + 285 fmoles/mg de 
proteine). 

2.6. Analyse de Scatchard de la liaison de [3J-I] -dexamethasone aux 
recepteurs de type sauvage et mutant 1747/T (Figure 3). 
25 On a applique Tanalyse de Scatchard a la liaison effectuee comme 

decrit sur la Figure 2. La constante de dissociation apparente du mutant 
GR(I747/T) (o) n f est que deux fois plus elevee que celle du hGR de type 
sauvage (D) (K^ = 5,1 + 1,9 par rapport a 2,7 + 1,3 nM). 
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2.7. Tableau I 

Activites transcriptionnelles et CE 5 o de clivers steroides avec hGR de type 
sauvage et hGR(1747/T) 

5 





Activite luciferase % 




CE50 


Ligand 


Type 


hGR 


Type 


hGR %CE 




sauvage 


(I747/T) 


sauvage 


(1747/T) 


Dexamethasone 


100 


100 


4xlOiOM 


4xlO-8M 100 


TA 


98 


102 


5x1O10M 


2xl0-8M 40 


RU28362 


90 


88 


3x10- iom 


7xlO-9M 23 


Fluocinolone 


75 


100 


l,5xlOi0M 


3xlO-9M 20 


Bimedrazol 


100 


180 


1O10M 


2xlO-9M 20 


Conisol 


110 


15 


7xl09M 


nm 


Corticosterone 


100 


0 


7xlO-»M 


nm 


Aldosterone 


90 


0 


5xlO«M 


nm 



20 Les co-transfections ont ete effectuees et les eourbes de reponse en 

fonction de la dose ont ete construites comme decrit sur la Figure 2. On a 
teste a six concentrations croissantcs, en double, le triamcinolone 
acetonide (TA), RU28362, le fluocinolone acetonide (fluocinolone), le 
Cortisol, la corticosterone et Taldosterone. Us essais de I'activite luciferase 

25 et de la ft-galactosidase ont ete effectues comme decrit dans "Materiels et 
Methodes". Les moyennes de trois essais independants sont donnees dans 
ce tableau, nm = non mesurable. 

2.8. Competition des activites de liaison de Dex et dc transactivation 
par RU486 (Figure 4). 

30 Des cellules Cos-7 transfectees avec le hGR de type sauvage (D) ou 

mutant I747T (•) ont ete mises a incuber pendant 1 heure a 37°C avec dc la 
[3H]-dexamethasone 10 nM seule ou en presence de la concentration 
indiquee de RU486 non marque, comme decrit dans "Materiels ct 
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10 



Methodes". Les donnees sont exprimees en pourcentage de la liaison 
specifique observee sur le temoin non soumis a la competition. Ces 
donnees representent la moyenne de determinations effectuees en double 
pour chaque concentration d'antagoniste. 

L'activite antagoniste a etc determinee sur des cellules CV-1 
transferees comme decrit sur la Figure 4 et traitees simultanement par 
Dex 10" 7 M et la concentration indiquee de RU486, 24 heures avant la recolte 
pour l'essai des activites luciferase et ft-galactosidase. 100 % d'activite sont 
definis pour chaque recepteur comme l'activite luciferase des cellules 
traitees par la Dex seule. Chaque point represente la moyenne d'au moins 
deux essais independants effectues en double. (0): hGR de type sauvage; 
(o): mutant 1747T. 

2.9. Tableau H 



15 



CE50 obtenue avec divers genes reporter 



Recepteur 



Gene rapporteur 



CE50 



GR de type sauvage 
20 GR(I747/T) 
Gal4-GR 

Gal4-GR ( j747/T) 

Gal4-GR 

Gal4-GR ( i747/T) 



pGRE-tk-Luc 
p(17M) 5 -RGlob-L.uc 

u 

p(17M) 5 -tata-Luc 



1O-10M 
2x10-8 M 
1.7.X109M 
1,5x107m 
2xlO-9M 
2x1 0^M 



Des cellules HeLa (pour les chimeras Gal4) ou des cellules CV-1 ont 
ete cotransfectees transitoirement avec divers vecieurs d'expression et 
genes reporter. L'efficacite de la transfection a ete standardisee en 
cotransfectant par 0,5 ng de vecteur pCMV-ftgal. Les cellules ont ete 

30 traitees pendant 24 heures par des concentrations croissantes de 
dexamethasone. Les essais de la luciferase et de la ft-galactosidase ont ete 
effectues comme decrit dans "Materiels et Methodes". L'activite luciferase 
est exprimee en pourcentage de Tactivite maximale obtenue pour chaque 
recepteur et chaque gene reporter. Les valeurs de la CE50 ont ete 

35 determines graphiquement. 
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2.10. R£capitulatif 

La mutation de 1'isoleucine 747 du recepteur humain des 
glucocorticoides en threonine resulte en une tres forte diminution, voire 
une abolition de Pactivite de transactivation du recepteur, en presence de 
5 glucocorticoides naturels, alors qu'a des concentrations similaires, des 
glucocorticoides synthetiques stimulent de fa<;on efficace l'activite de 
transactivation de ce recepteur mut£. 

11 est important de souligner que hGR(I747/T) repond totalement a 
une forte concentration de Dex, ce qui indique qu'il peut en principe 
10 transactiver aussi efficacement que sa contrepartie de type sauvage. En 
consequence, la fonction d'activation transcriptionnelle de AF-2 
elle-meme n'est apparemment pas alteree par la mutation, comme c'est le 
cas pour des recepteurs comportant des mutations dans la partie centrale 
de AF-2 (voir Introduction pour les references). 
15 3. Materiels et methodes 

3.1. Cultures cellulaires et transfection 

Les cellules CV-1 et Cos-7 ont ete cultivees dans du milieu d'Eagle 
modifie par Dulbeco (DMEM) contenant 10 % (v/v) de serum de veau foetal 
(SVF) (Gibco, Grand Island, NY), dans une atmosphere humidifiee 

20 contenant 5% de CO?. Les cellules HeLa ont ete cultivees dans les memes 
conditions. Les transfections transitoires ont ete effectuees dans des 
multi-plaques a 6 puits, selon le mode operatoire au phosphate de calcium 
deja decrit (42). Un plasmide recombinant de reference, pCMV-RGal, 
exprimant la ft-galactosidase bacterienne, a ete transfecte conjointement 

25 avec le vecteur d'expression du recepteur et le gene reporter 
correspondant, afin de corriger d'eventuelles variations de Tefficacite de 
la transfection. Le precipite a ete elimine par lavage au bout de 24 heures, 
et les cellules ont ete maintenues dans du DMEM sans SVF mais contenant 
de Thormone. Au bout d'encore 24 heures, les cellules ont ete rincees et 

30 lysees pendant 15 minutes avec 0,3 ml de tampon de lysc [Tris.phosphate 
25mM, pH 7,8, MgCl 2 8 mM, 1% de Triton X100, 10 % de glycerol (48))- 
L'activite luciferase correpondante a etc determinee sur une fraction 
aliquote (0,1 ml), par evaluation du pic de luminescence (pour un temps 
d^ntegration de 15 secondes), aprcs injection de 0,1 ml de luciferinc 1 mM 
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dans un luminometre LKB. La ft-galactosidase a etc determinee par la 
methode modifiee par Bocquel et al. (49), pour le controle de Pefficacite de 
chaque transfection. 

3.2. Plasmides utilises 
5 Les GR a deletion N-terminale, AA/B-GR ou AA/B-GR51747/T), qui 

exprimaient seulement les acides amines 368 a 777, ont ete obtenus a partir 
du fragment de digestion PstI-P/7MI du vecteur depression HGO ou 
pGR(1747/T), respectivement, ligature dans les sites correspondants de HG8 
(49). Le plasmide pGAL-GR (don de T. Lerouge) etait constitue du domaine 

10 de liaison a l'ADN de la proteine Gal4 de levure (aal-147) et du domaine de 
liaison a une hormone de GR (a500-777); pGal-GR(I747/T) a etc construit 
par insertion de la mutation dans pGal-GR. 

Le gene reporter pTAT-tk-Luc a ete fourni par D. Gagne et a ete 
construit comme suit: on a d'abord engendre un plasmide intermediate 

15 pTAT, par insertion du segment EcoRI-BamHI de 966 pb, provenant de 
pKT531 [fourni gracieusement par T. Grande (50)] dans les sites 
correspondants du vecteur pUCI9 (Pharmacia). Le fragment contenant la 
sequence codant pour la luciferase de luciole et le promoteur minimal 
thymidine kinase (tk) provenant du virus Herpes simplex a ete isole sous 

20 forme d r un fragment BamHI a partir de pvit-tk-Luc (51) et insere, cn aval 
du promoteur TAT, dans le site correspondant de pTAT. Le plasmide 
reporter pGRE-tk-Luc a etc construit par ligature du fragment de digestion 
Hindlll-Bglll de pGRE-tk-CAT (52), qui contient un GRE synthetique 
(AGAACAcagTGTTCT) en amont du promoteur minimal tk, dans les sites 

25 Hindlll-Bglll de pLuc (53). Le gene reporteur p(17M)s-ftGlob-Luc a ete 
decrit precedemment (54). Le plasmide reporter p(17M) 5 -tata-Luc a ete 
construit a partir du plasmide p(17M) 5 -tata-CAT (55) par digestion par 
XhoI-BamHI ct isolement du fragment contenant (17M5)-tata. Cc fragment 
a ete ensuite insere dans le vecteur pGL2 (Promega) digere par les memes 
30 enzymes de restriction. 

Le vecteur d'expression de la R-galactosidase pCMV-RGal contient la 
sequence codant pour la R-galactosidase, sous controle du puissant 
promoteur constitutif de cytomegalovirus (CMV). 
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3.3. Essai de liaison a une hormone 
Des cellules Cos-7 transfectees avec pCMV-SGal et hGR de type sauvage ou 
mutant I747/T ont ete recoltees 48 heures apres la transfection, dans une 
solution salee tamponnee au phosphate (STP), par grattage a l'aidc d'une 
5 spatule en caoutchouc. Les cellules ont ete lavees deux fois dans de la STP 
glacee. Toutes les etapes de la preparation de cytosols ont ete effectuees a 
4°C. On a remis les cellules en suspension dans 3 volumes de tampon de 
liaison [Na-HEPES 20 mM, pH 7,3, molybdate de sodium 20 mM et EDTA 5 mM 
(22)] et avec des inhibiteurs de protease [leucopeptine (5 ng/ml), 

10 aprotinine (5 Mg/ml), PMSF (40 ng/ml) et pepstatine A (5 ng/ml)], et on les 
a placees pendant 15 minutes sur de la glace. Les cellules ont ensuite ete 
lysees par 30-40 coups de piston dans un homogeneisateur en verre 
Dounce, et Thomogenat resultant a ete ensuite centrifuge a 110 000 g 
pendant 30 minutes. Le surnageant, denommc cytosol, a ete utilise 

15 immediatement pour l'essai de liaison a une hormone. Les concentrations 
de proteine ont ete determinees par le dosage de proteine Bio-Rad (Bio-Rad 
Laboratories, Hercules, CA, USA). Pour l'essai de liaison a une hormone, on 
a mis a incuber pendant une nuit a 4 e C un cytosol, contenant 1-3 mg de 
proteine/ml, avec de la [3H]-Dex (49 Cl/mmole; Radiochemical Center, 

20 Amersham, Angleterre) ou du Cortisol (67 Ci/mmole; Radiochemical 
Center, Amersham, Angleterre) sans (liaison totale) ou avec (liaison non 
specifique) un exces de 100 fois de compose radio-incrtc (10~ 5 M, Sigma 
Chemical Co., St. Louis, Mo, USA). On a ensuite traite les echantillons par 1 
volume de charbon-dextran (5% de charbon, 0,5% de dextran dans la 

25 solution de liaison) pendant 15 minutes dans de la glace, sous agitation 
constante, puis on les a soumis a une centrifugation pendant 10 minutes a 
12 000 g. Le ligand [3H] fixe a ete mesure dans une panic aliquote du 
surnageant, par comptage de scintillation. La constante de dissociation a 
Tequilibre (Kd) du recepteur pour la dexamethasone ou le Cortisol a ete 

30 determinee par analyse de Scatchard. 

Pour Tanalyse de liaison competitive, on a mis les cytosols a incuber 
avec 10 nM de [3H]-Dex et diverses concentrations de stcroides competitifs 
non radioactifs, dans les memes conditions que precedemment. Apres 
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traitement au charbon-dextran et comptage de scintillation, la liaison 
specifique a ete exprimee en pourcentage du temoin non soumis & une 
competition, et portee en fonction de la concentration du steroide en 
competition. Des essais de liaison competitive dans des cellules entieres ont 
5 6te effectues sur 10 6 cellules mises a incuber pendant 1 heure a 37°C avec 
10 nM de [3H]-Dex et diverses concentrations de steroides en competition. 
Apres sonication dans 1 ml de tampon KC1 (EDTA 1,5 mM, Tris.HCl 20 mM, pH 
7,4, KC1 0,5 M), on a elimine le steroide non lie par addition de deux 
volumes de charbon enrobe de dextran, dans du tampon KC1 a la gelatine 
10 (0,05 % de dextran, 0,5% de charbon, 0,1% de gelatine). On a mis le melange 
& incuber pendant 30 minutes a 4°C et on l'a centrifuge a 3 000 g pendant 
5 minutes. La radioactivite a ete determinee par comptage de scintillation 
en liquide et on a porte sur une courbe comme precedemment la liaison 
specifique. 

15 

EXEMPLI: 2 : Recombinase Cre chimerique dont I'activite est 
inductible par des glucocorticoides synthetiques, mais pas par des 
glucocorticoides naturels 

1. Materiel et methodes 

20 l.L Construction du vecteur pCre-LBD[GR(I747/T)] 

Un fragment d'ADN Clal-Xbal d'environ 1300 paires de base (pb), 
contenant la sequence codant pour le domaine de liaison du ligand du 
recepteur humain des glucocorticoides a etc isole du plasmide HG1 (voir 
Exemple 1 (40)) et ses extremites ont ete remplies par la T4 polymerase. Ce 

25 fragment a ete mute de sorte que les nucleotides ATT codant pour une 
isoleucine en position 747 du recepteur sauvage (56) sont remplaces par 
les nucleotides ACC, codant pour unc threonine. Ce fragment mute a ete 
clone dans le vecteur pCre-ER (28) digere par Xhol et PstI, dont les 
extremites ont egalement ete remplies par la T4 polymerase [plasmide 

30 pCre+GR(I747/T)+F; sequence codante du LBD de hGR(I747/T) dans la meme 
orientation que celle de Cre]. pCre-LBD[CR(1747/T)] a ete obtenu par 
mutagenese dirigee realisee sur TADN simple brin prepare a partir du 
plasmide pCre + GR(I747/T) + F, avec les oligonucleotides de synthese : 
- SG52 ( 5 -CTGG AAG ATGGCGATCTCGAGATTCAGCAGGCCACT-3 ') 

35 - SG53 (5' -CTGTTTCATCAAAAGGGTACCAGCCGTGGAGGGGCAT- 3') 
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permettant de fusionner d'une part la sequence d'ADN codant pour la Cre 
[amino acides (aa) 1-343 (orf2 (cre) ; (31)], et celle qui code pour la region 
contenant le LBD mute de HG1 [aa 500-777], d'autre part la sequence d'ADN 
prec6demment modifiee et celle codant pour la region F du recepteur 
5 humain des oestrogenes (ER) [aa 553-595 (57)] (Figure 5). Cette operation 
restaure le site de restriction Xhol situe a la fin des sequences Cre dans 
pCre-ER et introduit un site de restriction Kpnl entre les sequences codant 
pour GR et la region F du ER (Figures 6 et 7). 

1.2. Mutation du gene RXRa 

10 Le vecteur (pRXRa(LNU), utilise pour muter le gene RXRa (58) par 

recombinaison homologue dans les cellules F9 a etc construit de la facon 
suivante : 

Un phage X contenant un fragment genomique de 11.8 kb, 
comprenant les exons 2,3 et 4 de RXRa, a etc isole a partir d'une banque 

15 genomique realisee avec de PADN genomique de Pembryocarcinome 
murin PI 9, clone dans le vecteur X EMBL3. Un fragment Sail isole de ce 
phage (dont les extremites ont £te remplies par la T4 polymerase) a ete 
sous clone dans le site BamHl (apres traitement a la T4 polymerase) d'un 
derive du vecteur pBluescriptllSK* (Stratagene). Dans ce derive, le site 

20 Xhol a ete supprime. Un site Xhol a ete introduit dans Pexon 4 de RXRa au 
niveau du site AccI correspondant au nucleotide 535 de PADNc de RXRa (la 
sequence de PADNc de RXRa est donnee dans Genbank reference : M 
84817), en clonant dans le site Accl les oligonucleotides synthetiques 
suivants : 

25 - 5 '-ATTATTATrACTCG AGTGATG ATG-3 1 et, 

- 5 ATC ATC ATC ATCCG AGTAATAATA-3 1 . 

Enfin, le fragment Xhol, contenant la cassette d'expression du gene de 

resistance a la neomycine, entouree de sites loxP, isole du vecteur pHR56 

(28) a ete clone dans le site Xhol du vecteur precedent. 
30 La mutation d'un allele du gene RXRa dans des ellules F9 a ete 

effectuee par recombinaison homologue a Paide du vecteur pRXRa(LNL) 

(28). Cette lignee a etc appelee RXRa+MLNU. 

1.3. Expression de Cre-LBD[GR(1747/T)] dans des cellules comportant 
un fragment d'ADN modifie : RXRa(i-NL) 
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-Transfection transitoire : 5. 10& cellules RXRa*'-<LNL) ou cellules 
HeLa resuspendues dans 500 ^l de PBS ont ete electroporees avec 5 \ig de 
plasmide pCre-LBD[GR(I747/T)] [eventuellement cotransfectees avec 5 \ig 
du vecteur pRXRad-W pour les cellules Hela] a l'aide d'un electroporateur 
5 (Bio-Rad gene pulser), regie a 200 V et 960 |iF. Les cellules ont ensuite ete 
ensemens£es k 10& cellules par boite de 100 mm et traitees, si ntkressaire, 
avec des ligands. 

- Transfection stable : 5. 10* cellules RXRa+'-fLW, resuspendues dans 
500 pi de PBS ont ete electroporees avec 5 |ig de pCre-LBD[GR(I747/T)] et 
10 1 \ig de pPGK-Hyg (59), digeres respectivement par Sail et Pvull, a l'aide 
d'un electroporateur (Bio-Rad gene pulser), regie a 200 V et 960 nF. Les 
clones resistants ont ete obtenus selon la procedure dccrite par Metzger et 
al. (28). 

1.4. Amplification par "PCR" d'une region d'ADN genomique 
15 localisee dans Texon 4 de RXRa 

Les amplifications d'ADN ont ete realisees en utilisant la technique 
de "Polymerase Chain Reaction" (PCR), selon le protocole decrit par Chen 
and Evans (60). Les amorces utilisees sont : SB211 et PZ105, ayant 
respectivement comme sequence nucleotidique 5 , -GGCAAACACTATGG-3 > et 

20 5'-TTGCGTACTGTCCTCTT-3\ Apres denaturation pendant 8 min a 94°C, 2,5 
unites de Taq polymerase sont ajoutees. L'amplification est effectuee en 
realisant 35 cycles (30 sec. a 94°C, 30 sec. a 50°C) suivi d'un cycle (30 sec. a 
94 8 C, 30 sec. a 50°C, 5 min a 72°C) dont le produit est conserve a 4°C. 

Les produits des reactions ont ete separes sur gel de polyacrylamide 

25 (10 %) ou d'agarose (2,5%). L'ADN a ete visualise par UV suite a une 
coloration au bromure d'ethidium, ou par Southern Blot (42). 

1.5. Test d'excision des sequences situees entre les sites LoxP 
L'ADN de cellules RXRa + / -(LNL) t transfectees avec pCre- 

LBD[GR(I747/T)] ou le vecteur parental pSG5, non traitees ou traitees avec 
30 du Cortisol (10* 6 M) ou de la dexamethasone (10-&M) pendant 72 heures, a ete 
soumis a une reaction PCR selon la strategic decrite en Figure 8. Les 
produits de la reaction ont ete separes sur gel d'acrylamide et colores au 
bromure d'ethidium. La piste M sur la Figure 9 correspond au depot du 
marqueur de taille pBR322 digere par Hinfl. La position des alleles sauvage 
35 et recombine est indiquee. 
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1.6. Analyse par PCR de l'activite recombinase de Cre- 
LBD[GR(I747/T)] dans la lignee RXRa +/ -(Us'L> cxprimant la proteine 
chim£rique de facon constitutive. 

Pour la Figure 10, PADN prepare a partir de cellules RXRa +/ - 
5 (LNU:Cre-GR(I747/T) non traitees ou traitees au Cortisol (10-&M) ou a la 
dexamethasone (10-&M) a servi de matrice pour realiser une amplification 
par PCR, selon la procedure decrite en Figure 8. L'ADN amplifie a ete 
separe sur gel d'acrylamide et colore au bromure d'ethidium. Les pistes 1, 
2, 3 et 4 contiennent respectivement les produits de PCR realises avec de 
10 PADN extrait de cellules F9 sauvages (WT), RXRa+'-<LNL) t RXRa+'-<U et de 
C2RXRa-(U/-(U (73). La piste 8 contient un marqueur de taille (echelle de 
lkb ; GibcoBRL). 

Sur la Figure 11, PADN prepare a partir de cellules RXRa +/ -(LNU:Cre- 
GR(I747/T) non traitees ou traitees avec de Paldosterone, du Cortisol, de la 

15 corticosterone, de la dexamethasone, de la triamcinolone acetonide ou du 
RU486, a des concentrations allant de 10^ a 10'*>M t a servi de matrice pour 
realiser une amplification par PCR, selon la procedure decrite en Figure 8. 
L'ADN amplifie a ete separe sur gel d'agarose et analyse selon la technique 
de Southern. Les fragments amplifies correspondant aux alleles sauvage et 

20 recombine ont £te detects par hybridation a Paide de Poligonucleotide de 
synthese (5'-AAGAAGCCCTTGCAGCCCTC-3 p ), radiomarque a Pextremite 5' par 
de la T4 polynucleotide kinase. Le signal a ete visualite et quantifie a Paide 
d'un "phospho-imager" (Fujix bas2000). 

Pour la Figure 12, des cellules RXRa+^LNU : Cre-CR(I747/T) ont etc 

25 cultivees pendant 72 h dans du milieu de culture auquel ont ete ajoutes 
trois ligands naturels (Paldosterone, le Cortisol et la corticosterone) a la 
concentration de 10-9 m ou 10*8 M et de la dexamethasone (10* 7 ou 10-6 M) 
comme indique. L'allele recombine a ete detecte selon la procedure decrite 
en Figure 8. L'ADN amplifie a ete separe sur gel d'agarose et analyse selon 

30 la technique Southern. Les fragments amplifies correspondant a l'allele 
recombine ont ete detectes par autoradiographic, suite a une hybridation 
avec Poligonucleotide de synthese 

5'-AATTATAACTTCGTATAATGTATGCTATACGAAGTTATTC - 3', (contenant un 
site loxP) radiomarque au Phosphore 32 a Pextremite 5' par la T4 
35 polynucleotide kinase. 
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Pour la Figure 13, des cellules HeLa ont ete cotransfectees par les 
plasmides pRXRa(LNL) e t pCre-LBD[GR(I747/T)], puis cultivees pendant 
72 heures avec ou sans addition des ligands indiques, a la concentration de 
10 7 M. L'ADN de ces cellules a ensuite ete soumis a une amplification PCR 
5 selon la strategic decrite. Les produits de la reaction ont ete separes sur gel 
d'acrylamide et colores au bromure d'ethidium. La piste 1 correspond au 
depot du marqueur de taille 1 kb ladder (echelle de Ikb, GibcoBRL). 

2. Resultats 

Afin d'exprimer une recombinase Cre dont Pactivite soit inductible 

10 par des ligands synthetiques du recepteur des glucocorticoides, mais non 
par des ligands glucocorticoides naturels aux concentrations 
"physiologiques", on a construit un vecteur d'expression, pCre- 
LBD[GR(I747/T)], derive du vecteur pCre-ER (28) en remplacant la 
sequence d'ADN codant pour les acides amines 344-618 contenant le LBD du 

15 recepteur des oestrogenes (RE), par celle codant pour les acides amines 
500-777 d'un recepteur des glucocorticoides (GR) mute contenant le 
domaine de liaison (LBD) mute du GR(I747/T). La construction de ce 
plasmide a conduit a Pinsertion de la sequence GGTACC, codant pour les aa 
Gly-Thr en position 624-625 de Cre-LBD[GR(1747/T)] (Figure 7). 

20 L'activite recombinase de Cre-LBD[GR(I747/T)] a ete testee dans une 

lignee cellulaire murine RXRa+'MLNL). Cette lignee a etc obtenue en 
integrant par recombinaison homologue le gene TK-neo, encadre de sites 
loxP (en repetition directe) (LNL), dans Pexon 4 d'un allele du gene RXRa 
(28). Le gene TK-neo est un gene chimerique permettant ['expression 

25 d'une proteine de fusion thymidine kinase/gene dc resistance a la 
neomycine. L'electroporation de cette lignee avec le vecteur pCre- 
LBD[GR(I747/T)] a permis d'evaluer son activite recombinase sans ajout de 
ligand, ou apres addition de Cortisol (Iigand nature!) ou de dexamethasone 
(Figure 9) (Dex ; ligand synthetique). L'ADN des cellules ainsi traitees est 

30 en effet soumis a une PCR avec des oligonucleotides synthetiques localises 
dans Pexon 4, Pun en amont du site Accl, Pautre en aval de ce site. La taille 
des fragments PCR obtenus avec cette paire d'oligonucleotides, est de 65 pb 
pour Pallele sauvage, de 3345 pb pour Pallele mute (apres integration de 
LNL) et de 191 pb pour Pallele recombine (apres excision des sequences 
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situees entre les deux sites lox et d'un des sites lox, voir figure 8). Suite a 
un traitement des cellules transfectees a la dexamethasone (10-6 M), un 
fragment de 191 pb est observe, refletant la presence de sequences 
correspondant a 1'allele recomWne, alors qu'en 1'absence de traitement ou 
5 suite a un traitement au Cortisol (10-6 M), aucun fragment de cette taille 
n'est observe. Ces resultats montrent done que Tactivite recombinase de la 
proteine de fusion etudiee peut etre induite en traitant des cellules 
exprimant cette proteine avec un ligand synthetique du GR tel que la 
dexamethasone mais pas avec un ligand naturel tel que le Cortisol, a la 

10 concentration de 10 6 M. 

On a egalement etabli une lignee RXRa+'-tLNU exprimant de facon 
constitutive Cre-LBD[GR(1747/T)], en cointegrant la cassette depression 
du gene Cre-LBD[GR(I747/T)] avec un vecteur exprimant le gene de 
resistance a l'hygromycine (RXRa+/-(LNU : Cre-GR(1747/T) ; voir "Materiel 

15 et Methodes" ; donnees non presentees). L'activite recombinase a ete testee 
suite a un traitement de ces cellules avec de la Dex (10-&M) pendant 72 
heures. L'analyse des produits des PCR effectuees sur PADN de ces cellules 
revele un fragment de 191 pb correspondant a i'allele recombine 
uniquement apres traitement a la Dex (Figure 10). 

20 Ainsi, il est montre que Cre-LBD[GR(I747/T)] est inactive sans ajout 

de ligand ou en presence de Cortisol a 10-6 m, ma is active en presence de 
Dex, lorsque sa cassette d'expression est integree dans le genome. 

On a egalement evalue la cinetique d'action de la recombinase : son 
activite est detectable des 12h de traitement a la dexamethasone a 10" 6 M 

25 mais elle est beaucoup plus forte apres 72h de traitement (resultats non 
presentes). 

L'activite recombinase de Cre-LBD[GR(1747/T)] a aussi ete testee 
suite a I'addition de differentes concentrations de ligands. Aucune activite 
recombinase n'a pu etre observee dans les cellules RXRa +/ -( LNL >:Cre- 
30 GR(I747/T) traitees a Taldosterone, at Cortisol ou a la corticosterone 
(concentration des ligands allant de 10-* M), alors qu'en presence de 

dex, de triamcinolone acetonide ou de RU486, une activite recombinase est 
observee des 10-9 M (Figure 11). 
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On a egalement montre a I'aide de cette lignee cellulaire que 
1'activite recombinase de Cre-LBD[GR(I747/T)) peut etre induite par des 
ligands synthetiques, meme lorsque les cellules sont cultivees en presence 
de ligands naturels (aldosterone, Cortisol et corticosterone) a 10-9 ou lO 8 M. 
5 L'excision de sequences localisees entre les sites loxP est obtenue suite a f 
un traitement de 72h a la dexamethasone a 10-7 M ou 10-6 m (Figure 12). 

L'activite recombinase de Cre-LBD[GR(I747/T)] a enfin ete testee 
dans des cellules humaines : des cellules HeLa ont ete cotransfectees 
transitoirement avec les vecteurs pCre-LBD[GR(I747/T)] et pRXRa<ua>, 

10 puis cultivees soit sans ajout de ligand, soit en presence des ligands 
indiques sur la Figure 13. Comme dans les cellules F9, une bande de 191 pb, 
correspondant au fragment recombine, est amplifiee a partir d'ADN isole 
des cellules traitees avec des ligands synthetiques (Dexamethasone, 
Triamcinolone acetonide ou RU486 a 10-7 m), alors que sans ajout de ligand, 

15 ou en presence de ligands naturels tels que l'aldosterone, la corticosterone 
ou le Cortisol aux memes concentrations, seul le fragment correspondant a 
l'allele sauvage peut etre detecte. 

Ces resultats montrent done que 1'activite recombinase de la 
proteine de fusion Cre-LBD[GR(I747/T)] est induite par des ligands 

20 synthetiques du recepteur des glucocorticoides, alors qu'elle est insensible 
aux ligands naturels tels que le Cortisol, la corticosterone ou l'aldosterone, 
meme a des concentrations aussi elevees que 10-& M. De plus, la presence de 
ligands naturels n'empeche pas 1'induction de Tactivite recombinase de 
Cre-LBD[GR(1747/T)] par les ligands synthetiques. 

25 

EXEMPLE 3 : Induction de 1'activite d'une recombinase Cre 
chimerique chez la souris 

1. Materiel et Methodes 

1.1. Construction de plasmides et etablissement de souris 
30 transgeniques 

Le vecteur pCMVCre-LBD[GR(1747/T)] a ete construit en clonant le 
fragment EcoRI dc 2 kb isole de pCre-LBD[GR(I747/T)l dans le site EcoRI de 
pMGSVl (60). Le fragment PvuII de 4,64 kb isole de 
pCMVCre-LBD[GR(I747/T)] a ete injecte dans des zygotes Fl (C57BL/6 X SJL) 
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& une concentration de 4 ng/^l afin de produire des souris transgeniques 
selon la procedure classique (61). 

1.2. Conditions de PCR 

Les amplifications par PCR ont ete realises dans une solution 
5 tampon contenant 10 mM Tris-HCi (pH = 8.8), 50 mM KC1, 1,5 mM MgC12, 
0,2 mM dNTPs, 0,25 jxM de chaque amorce, 2 unites de Taq polymerase et 
1 jxg d'ADN genomique comme matrice. Aprds 30 cycles (30 sec a 94°C, 
30 sec k 55°C f 1 min a 72°C) puis 1 cycle (30 sec k 90°C, 30 sec a 55°C, 5 min a 
72°C), les produits d'amplification ont etc separes sur gel d'agarose a 2.2 % 
10 colore au bromure d'ethidium. 

1.3. Analyse du genotype des souris. 

Le transgene Cre-LBD[GR(I747/T)] et les alleles de type sauvage et 
excise RXRaAAF2<LNi) ont ete detectes par PCR. La detection du transgene 
Cre-LBD[GR(I747/T)] a ete effectuee a l'aide des amorces nucleotidiques 

15 5 -ATCCG AAAAGAAAACGTTGA-3 ' et 5 '-ATCCAGGTrACGGATATAGT-3 \ celle des 
alleles du gene RXRa grace aux amorces SM^CTTCrCCGGCCGCTTGGGT-S' et 
5'-GAAGGCGATGCGCTGCGAAT-3\ De la meme facon, Pexcision du marqueur 
tk-neo encadre de sites loxP a ete suivie par PCR a l'aide des amorces A 
(5 , -CAAGGAGCCTCCTTTCTCTA-3 , ) et B (5 , -CCTGCTCTACCTGGTGACTT-3 , ). Ces 

20 amorces amplifient un fragment d'ADN de 156 paires de bases a partir de 
Pallele de type sauvage et un fragment de 190 paires de bases a partir dc 
Pallele excise RXRqaaF2(U. 
2. Resultats 

L'activite recombinase de Cre-LBD[GR(1747/T)] a egalement ete 
25 testee chez la souris. Ainsi, des souris transgeniques exprimant la proteine 
de fusion Cre-LBD[GR(I747/T)] sous le controle du promoteur du gene 
"major IE M du cytomegalovirus human ont ete etablies. La structure du 
transgene est representee a la figure 14a. II contient les sequences 
activatrices/promotrices du gene "major IP du cytomegalovirus humain, 
30 un intron du gene de la p-globine de lapin, les sequences codantes de 
Cre-LBD[GR(I747/T)] et le signal de polyadenylation du virus simien SV40. 
Le site d'initiation de la transcription est indique par unc Heche. Ces 
souris ont ensuite ete croisees avec des souris Yeportcr', afin d'y 
demontrer l'existence d f une activite recombinase induite. Cette lignee 
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'reporter* contient une insertion du marqueur de selection tk-neo, 
encadre de sites loxP, dans I'intron situe entre les exons 8 el 9 du gene 
RXRa, sur Tun de ses deux alleles [RXRaAAF2(LNU]. Apres recombinaison du 
marqueur tkneo, un site loxP reste en place et constitue 1'allele excise 
RXR a AAF2(L). L'allele RXRa de type sauvage et 1'allele excise peuvent etre 
detectes simultanement par amplification PCR en utilisant une paire 
d'amorce appropriee A et B. La figure 14b represente schematiquement 
cette strategic PCR par indication des amorces A et B ainsi que de certains 
sites de restriction. 

Les descendants issus du croisement de souris Cre-LBD[GR(I747/T)] 
et de souris 'reporter', decrites ci-dessus, contenant a la fois le transgene 
Cre-LBD[GR(I747/T)] et 1'allele RXRaAAF2(LNL) ) Q nt ete identifies en 
etablissant leur genopype a partir d'une biopsie de queue. Une de ces 
souris a subi a Tage de quatre semaines une injection intraperitoneale 
quotidienne de 0.3 mg de dexamethasone diluee dans 100 nl d'huile 
vegetale, pendant cinq jours. Une biopsie de queue a ete prelevee le jour 
avant la premiere injection, ainsi que le lendemain de la cinquieme 
injection. L'ADN isole a partir de ces prelevements a ete analyse par PCR a 
1'aide des oligonucleotides A et B (figure 15, pistes 2 et 3) pour determiner 
si le traitement induit la deletion du marqueur ik-neo. La piste 1 
correspond a unc reaction controle, realisee sans ADN. La position des 
produits de PCR amplifies a partir de 1'allele RXRa de type sauvage et de 
1'allele excise RXRa*AF2(L) S ont indiques. Le marqueur de taiile (piste 4) 
correspond a Techelle de 1 kb (GibcoBRL). La taiile des fragments est 
donnee en paires de bases. D'apres la figure 15, Texcision induite a bien eu 
lieu apres traitement de la souris testee a la dexamethasone. En effet, 
Tanalyse des fragments d'ADN amplifies a partir de la queue avant 
traitement ne revele que la presence de Tallele RXRa de type sauvage, 
alors que Tanalyse de la queue de la meme souris, apres traitement, 
indique la presence de Tallele excise RXRa*AF2(LNL) (figure 15). Ainsi, il 
apparait que la recombinase chimerique Cre-LBD[CR(I747/T)] ne presente 
aucune activite constitutive de base en presence des ligands endogenes. 
Elle est cepedant induite et active chez la souris par un traitement a la 
dexamethasone. 
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LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 

(i) DEPOSANT: 

(A) NOM : ASSOCIATION POUR LE DEVELOPPEMENT DE LA 

RECHERCHE GENETIQUE MOLECULAIRE (ADEREGEM) 

(B) RUE: 26 RUE MONTPENSIER 

(C) VILLE: PARIS 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75001 

(ii) TITRE DE L * INVENTION: RECEPTEUR NUCLEAI RE DE GLUCOCORTICOIDES 
MODI FIE, PROTEINE DE FUSION, FRAGMENTS D 1 ADN CODANT POUR LEDIT 
RECEPTEUR ET LADITE PROTEINE DE FUSION, VECTEURS, CELLULES ET ANIMAUX 
EN COMPRENANT ET PROCEDES DANS LESQUELS ILS SONT MIS EN OEUVRE 

(iii) NOM B RE DE SEQUENCES: 17 

(iv) FORME DECHIFFRABLE PAR ORDINATEUR: 
(A) TYPE DE SUPPORT: Floppy disk 
{3) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC-DOS/MS-DOS 

(D) LOGICIEL: Patentln Release #1.0, Version $1.30 (OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2334 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE: 

(A) NOM /CLE : GR<I747/T) (Recepteur humain des glucocorticoids 

mute en position -747) 

(3) EMPLACEMENT: 1 . . 2331 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 777 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 1: 

ATG GAC TCC AAA GAA TCA TTA ACT CCT GGT AGA GAA GAA AAC CCC AGC 4 3 

Met Asp Ser Lys Glu Ser Leu Thr Pro Gly Arg Glu Glu Asn Pro Ser 

15 10 15 

AGT GTG CTT GCT CAG GAG AGG GGA GAT GTG ATG GAC TTC TAT AAA ACC 96 

Ser Val Leu Ala Gin Glu Arg Gly Asp Val Met Asp Phe Tyr Lys Thr 

20 25 30 

CTA AGA GGA GGA GCT ACT GTG AAG GTT TCT GCG TCT TCA CCC TCA CTG 14 4 

Leu Arg Gly Gly Ala Thr Val Lys Val Ser Ala Ser Ser Pro Ser Leu 

35 40 45 
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GCT GTC GCT TCT CAA TCA GAC TCC AAG CAG CGA AGA CTT TTG GTT GAT 192 
Ala Val Ala Ser Gin Ser Asp Ser Lys Gin Arg Arg Leu Leu Val Asp 
50 55 60 

TTT CCA AAA GGC TCA GTA AGC AAT GCG CAG CAG CCA GAT CTG TCC AAA 24 0 

Phe Pro Lys Gly Ser Val Ser Asn Ala Gin Gin Pro Asp Leu Ser Lvs 
65 70 75 80 

GCA GTT TCA CTC TCA ATG GGA CTG TAT ATG GGA GAG ACA GAA ACA AAA 268 
Ala Val Ser Leu Ser Met Gly Leu Tyr Met Gly Glu Thr Glu Thr Lys 
85 90 95 

GTG ATG GGA AAT GAC CTG GGA TTC CCA CAG CAG GGC CAA ATC AGC CTT 336 
Val Met Gly Asn Asp Leu Gly Phe Pro Gin Gin Gly Gin He Ser Leu 
100 105 110 

TCC TCG GGG GAA ACA GAC TTA AAG CTT TTG GAA GAA AGC ATT GCA AAC 38 4 

Ser Ser Gly Glu Thr Asp Leu Lys Leu Leu Glu Glu Ser He Ala Asn 
115 120 125 

CTC AAT AGG TCG ACC AGT GTT CCA GAG AAC CCC AAG AGT TCA GCA TCC 4 32 

Leu Asn Arg Ser Thr Ser Val Pro Glu Asn Pro Lys Ser Ser Ala Ser 
130 135 140 

ACT GCT GTG TCT GCT GCC CCC ACA GAG AAG GAG TTT CCA AAA ACT CAC 4 80 

Thr Ala Val Ser Ala Ala Pro Thr Glu Lys Glu Phe Pro Lys Thr His 
145 150 155 160 

TCT GAT GTA TCT TCA GAA CAG CAA CAT TTG AAG GGC CAG ACT GGC ACC 528 
Ser Asp Val Ser Ser Glu Gin Gin His Leu Lys Gly Gin Thr Gly Thr 
165 170 ' 175 

AAC GGT GGC AAT GTG AAA TTG TAT ACC ACA GAC CAA AGC ACC TTT GAC 57 6 

Asn Gly Gly Asn Val Lys Leu Tyr Thr Thr Asp Gin Ser Thr Phe Asp 
180 185 190 

ATT TTG CAG GAT TTG GAG TTT TCT TCT GGG TCC CCA GGT AAA GAG ACG 624 
He Leu Gin Asp Leu Glu Phe Ser Ser Gly Ser Pro Gly Lys Glu Thr 
195 200 205 

AAT GAG AGT CCT TGG AGA TCA GAC CTG TTG ATA GAT GAA AAC TGT TTG 67 2 

Asn Glu Ser Pro Trp Arg Ser Asp Leu Leu He Asp Glu Asn Cys Leu 
210 ' 215 220 

CTT TCT CCT CTG GCG GGA GAA GAC GAT TCA TTC CTT TTG GAA GGA AAC 720 
Leu Ser Pro Leu Ala Gly Glu Asp Asp Ser Phe Leu Leu Glu Gly Asn 
225 230 235 240 

TCG AAT GAG GAC TGC AAG CCT CTC ATT TTA CCG GAC ACT AAA CCC AAA 7 68 

Ser Asn Glu Asp Cys Lys Pro Leu He Leu Pro Asp Thr Lys Pro Lys 
245 250 255 

ATT AAG GAT AAT GGA GAT CTG GTT TTG TCA AGC CCC AGT AAT GTA ACA 816 
He Lys Asp Asn Gly Asp Leu Val Leu Ser Ser Pro Ser Asn Val Thr 
260 265 270 

CTG CCC CAA GTG AAA ACA GAA AAA GAA GAT TTC ATC GAA CTC TGC ACC 8 64 

Leu Pro Gin Val Lvs Thr Glu Lys Glu Asp Phe lie Glu Leu Cys Thr 
275 280 285 

CCT GGG GTA ATT AAG CAA GAG AAA CTG GGC ACA GTT TAC TGT CAG GCA 912 
Pro Gly Val He Lys Gin Glu Lys Leu Gly Thr Val Tyr Cys Gin Ala 
290 295 300 

AGC TTT CCT GGA GCA AAT ATA ATT GGT AAT AAA ATG TCT GCC ATT TCT 960 
Ser Phe Pro Gly Ala Asn He He Gly Asn Lys Met Ser Ala lie Ser 
305 310 " 315 320 
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GTT CAT GGT GTG AGT ACC TCT GGA GGA CAG ATG TAC CAC TAT GAC ATG 1008 
Val His Giy Val Ser Thr Ser Gly Gly Gin Met Tyr His Tyr Asd Met 
325 330 335 

AAT ACA GCA TCC CTT TCT CAA CAG CAG GAT CAG AAG CCT ATT TTT AAT 1056 
Asn Thr Ala Ser Leu Ser Gin Gin Gin Asp Gin Lys Pro He Phe Asn 
340 345 * 350 

GTC ATT CCA CCA ATT CCC GTT GGT TCC GAA AAT TGG AAT AGG TGC CAA 1104 
Val He Pro Pro He Pro Val Gly Ser Glu Asn Trp Asn Arg Cys Gin 
355 360 365 

GGA TCT GGA GAT GAC AAC TTG ACT TCT CTG GGG ACT CTG AAC TTC CCT 1152 
Gly Ser Gly Asp Asp Asn Leu Thr Ser Leu Gly Thr Leu Asn Phe Pro 
370 375 380 

GGT CGA ACA GTT TTT TCT AAT GGC TAT TCA AGC CCC AGC ATG AGA CCA 1200 
Gly Arg Thr Val Phe Ser Asn Gly Tyr Ser Ser Pro Ser Met Arg Pro 
385 390 395 400 

GAT GTA AGC TCT CCT CCA TCC AGC TCC TCA ACA GCA ACA ACA GGA CCA 124 3 

Asp Val Ser Ser Pro Pro Ser Ser Ser Ser Thr Ala Thr Thr Gly Pro 
405 410 415 

CCT CCC AAA CTC TGC CTG GTG TGC TCT GAT GAA GCT TCA GGA TGT CAT 1296 
Pro Pro Lys Leu Cys Leu Val Cys Ser Asp Glu Ala Ser Gly Cvs His 
420 425 430 

TAT GGA GTC TTA ACT TGT GGA AGC TGT AAA GTT TTC TTC AAA AGA GCA 134 4 

Tyr Gly Val Leu Thr Cys Gly Ser Cys Lys Val Phe Phe Lys Arg Ala 
435 440 445 

GTG GAA GGA CAG CAC AAT TAC CTA TGT GCT GGA AGG AAT GAT TGC ATC 1392 
Val Glu Gly Gin His Asn Tyr Leu Cys Ala Gly Arg Asn Asp Cys lie 
450 455 460 

ATC GAT AAA ATT CGA AGA AAA AAC TGC CCA GCA TGC CGC TAT CGA AAA 14 40 

He Asp Lys He Arg Arg Lys Asn Cys Pro Ala Cys Arg Tyr Arg Lys 
465 470 475 480 

TGT CTT CAG GCT GGA ATG AAC CTG GAA GCT CGA AAA ACA AAG AAA AAA 143 3 

Cys Leu Gin Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys Lys Lvs 
485 490 495 

ATA AAA GGA ATT CAG CAG GCC ACT ACA GGA GTC TCA CAA GAA ACC TCT 1536 
He Lys Gly He Gin Gin Ala Thr Thr Gly Val Ser Gin Glu Thr Ser 
500 505 510 

GAA AAT CCT GGT AAC AAA ACA ATA GTT CCT GCA ACG TTA CCA CAA CTC 158 4 

Glu Asn Pro Gly Asn Lys Thr He Val Pro Ala Thr Leu Pro Gin Leu 
515 520 525 

ACC CCT ACC CTG GTG TCA CTG TTG GAG GTT ATT GAA CCT GAA GTG TTA 1632 
Thr Pro Thr Leu Val Ser Leu Leu Glu Val lie Glu Pro Glu Val Leu 
530 535 540 

TAT GCA GGA TAT GAT AGC TCT GTT CCA GAC TCA ACT TGG AGG ATC ATG 1630 
Tyr Ala Gly Tyr Asp Ser Ser Val Pro Asp Ser Thr Trp Arg He Met 
545 550 555 560 

ACT ACG CTC AAC ATG TTA GGA GGG CGG CAA GTG ATT GCA GCA GTG AAA 172 8 

Thr Thr Leu Asn Met Leu Gly Gly Arg Gin Val He Ala Ala Val Lys 
565 570 575 

TGG GCA AAG GCA ATA CCA GGT TTC AGG AAC TTA CAC CTG GAT GAC CAA 17 7 6 

Trp Ala Lys Ala lie Pro Gly Phe Arg Asn Leu His Leu Asp Asp Gin 
580 585 590 
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ATG ACC CTA CTG CAG TAC TCC TGG ATG TTT CTT ATG GCA TTT GCT CTG 1824 
Met Thr Leu Leu Gin Tyr Ser TrD Met Phe Leu Met Ala Phe Ala Leu 
595 600 605 

GGG TGG AGA TCA TAT AGA CAA TCA AGT GCA AAC CTG CTG TGT TTT GCT 18 72 

Gly Trp Arg Ser Tyr Arg Gin Ser Ser Ala Asn Leu Leu Cys Phe Ala 
610 615 620 

CCT GAT CTG ATT ATT AAT GAG CAG AGA ATG ACT CTA CCC TGC ATG TAC 1920 
Pro Asp Leu lie lie Asn Glu Gin Arg Met Thr Leu Pro Cys Met Tyr 
625 630 635 ~ 640 

GAC CAA TGT AAA CAC ATG CTG TAT GTT TCC TCT GAG TTA CAC AGG CTT 1968 
Asp Gin Cys Lys His Met Leu Tyr Val Ser Ser Glu Leu His Arg Leu 
645 650 655 

CAG GTA TCT TAT GAA GAG TAT CTC TGT ATG AAA ACC TTA CTG CTT CTC 2016 
Gin Val Ser Tyr Glu Glu Tyr Leu Cys Met Lys Thr Leu Leu Leu Leu 
660 665 * 670 

TCT TCA GTT CCT AAG GAC GGT CTG AAG AGC CAA GAG CTA TTT GAT GAA 2064 
Ser Ser Val Pro Lys Asp Gly Leu Lys Ser Gin Glu Leu Phe Asp Glu 
675 680 685 

ATT AGA ATG ACC TAC ATC AAA GAG CTA GGA AAA GCC ATT GTC AAG AGG 2112 
He Arg Met Thr Tyr He Lys Glu Leu Gly Lys Ala He Val Lys Arg 
690 695 700 

GAA GGA AAC TCC AGC CAG AAC TGG CAG CGG TTT TAT CAA CTG ACA AAA 2160 
Glu Gly Asn Ser Ser Gin Asn Trp Gin Arg Phe Tyr Gin Leu Thr Lys 
705 710 715 720 

CTC TTG GAT TCT ATG CAT GAA GTG GTT GAA AAT CTC CTT AAC TAT TGC 2208 
Leu Leu Asp Ser Met His Glu Val Val Glu Asn Leu Leu Asn Tyr Cys 
725 730 735 

TTC CAA ACA TTT TTG GAT AAG ACC ATG TCC ACC GAG TTC CCC GAG ATG 225 6 

Phe Gin Thr Phe Leu Asd Lvs Thr Met Ser Thr Glu Phe Pro Glu Met 
740 745 750 

TTA GCT GAA ATC ATC ACC AAT CAG ATA CCA AAA TAT TCA AAT GGA AAT 2304 
Leu Ala Glu He He Thr Asn Gin He Pro Lys Tyr Ser Asn Gly Asn 
755 760 765 

ATC AAA AAA CTT CTG TTT CAT CAA AAG TGA 2 334 

He Lys Lys Leu Leu Phe His Gin Lys 
770 775 



(2) INFORMATIONS POUR LA SEQ ID NO: 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 2004 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CRE-LBD(GR{I747/T) 



<B) EMPLACEMENT: 1. .2001 



(Proteine de fusion du domaine 
LBD du recepteur humain des 
glucocorticoides mute en 
position 747 et de la proteine 
recombinase Cre) 
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(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 667 acicies amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 2: 

ATG TCC AAT TTA CTG ACC GTA CAC CAA AAT TTG CCT GCA TTA CCG GTC 4 8 

Met Ser Asn Leu Leu Thr Val His Gin Asn Leu Pro Ala Leu Pro Val 
15 10 15 

GAT GCA ACG AGT GAT GAG GTT CGC AAG AAC CTG ATG GAC ATG TTC AGG 96 
Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asd Met Phe Arg 
20 25 * 30 

GAT CGC CAG GCG TTT TCT GAG CAT ACC TGG AAA ATG CTT CTG TCC GTT 14 4 

Asp Arg Gin Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val 
35 40 45 

TGC CGG TCG TGG GCG GCA TGG TGC AAG TTG AAT AAC CGG AAA TGG TTT 192 
Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys TrD Phe 
50 55 60 

CCC GCA GAA CCT GAA GAT GTT CGC GAT TAT CTT CTA TAT CTT CAG GCG 24 0 

Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gin Ala 
65 70 75 80 

CGC GGT CTG GCA GTA AAA ACT ATC CAG CAA CAT TTG GGC CAG CTA AAC 2 88 

Arg Gly Leu Ala Val Lys Thr lie Gin Gin His Leu Gly Gin Leu Asn 
8 5 90 J 95 

ATG CTT CAT CGT CGG TCC GGG CTG CCA CGA CCA AGT GAC AGC AAT GCT 336 
Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala 
100 105 110 

GTT TCA CTG GTT ATG CGG CGG ATC CGA AAA GAA AAC GTT GAT GCC GGT 38 4 

Val Ser Leu Val Met Arg Arg He Arg Lys Glu Asn Val Asp Ala Gly 
115 120 125 

GAA CGT GCA AAA CAG GCT CTA GCG TTC GAA CGC ACT GAT TTC GAC CAG 4 32 

Glu Arg Ala Lys Gin Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gin 
130 135 140 

GTT CGT TCA CTC ATG GAA AAT AGC GAT CGC TGC CAG GAT ATA CGT AAT 4 80 

Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gin Asp He Arg Asn 
145 150 155 160 

CTG GCA TTT CTG GGG ATT GCT TAT AAC ACC CTG TTA CGT ATA GCC GAA 528 
Leu Ala Phe Leu Gly He Ala Tyr Asn Thr Leu Leu Arg He Ala Glu 
165 170 175 

ATT GCC AGG ATC AGG GTT kAA GAT ATC TCA CGT ACT GAC GGT GGG AG A 57 6 

He Ala Arg He Arg Val Lys Asp lie Ser Arg Thr Asp Gly Gly Arg 
180 185 190 

ATG TTA ATC CAT ATT GGC AGA ACG AAA ACG CTG GTT AGC ACC GCA GGT 62 4 

Met Leu He His lie Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Glv 
195 200 205 

GTA GAG AAG GCA CTT AGC CTG GGG GTA ACT AAA CTG GTC GAG CGA TGG 672 
Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg TrD 
210 215 220 



WO 97/31108 52 PCT/FR97/00315 

ATT TCC GTC TCT GGT GTA GCT GAT GAT CCG AAT AAC TAC CTG TTT TGC 7 20 

lie Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys 
225 230 235 240 

CGG GTC AGA AAA AAT GGT GTT GCC GCG CCA TCT GCC ACC AGC CAG CTA 7 68 

Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gin Leu 
245 250 255 

TCA ACT CGC GCC CTG GAA GGG ATT TTT GAA GCA ACT CAT CGA TTG ATT 816 
Ser Thr Arg Ala Leu Glu Gly lie Phe Glu Ala Thr His Arg Leu lie 
260 265 270 

TAC GGC GCT AAG GAT GAC TCT GGT CAG AGA TAC CTG GCC TGG TCT GGA 8 64 

Tyr Gly Ala Lys Asp Asp Ser Gly Gin Arg Tyr Leu Ala Trp Ser Gly 
275 280 285 

CAC AGT GCC CGT GTC GGA GCC GCG CGA GAT ATG GCC CGC GCT GGA GTT 912 
His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val 
290 295 300 

TCA ATA CCG GAG ATC ATG CAA GCT GGT GGC TGG ACC AAT GTA AAT ATT 960 
Ser lie Pro Glu He Met Gin Ala Gly Gly Trp Thr Asn Val Asn He 
305 310 315 320 

GTC ATG AAC TAT ATC CGT AAC CTG GAT AGT GAA ACA GGG GCA ATG GTG 1003 
Val Met Asn Tyr He Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val 
325 330 335 

CGC CTG CTG GAA GAT GGC GAT CTC GAG ATT CAG CAG GCC ACT ACA GGA 105 6 

Arg Leu Leu Glu Asp Gly Asp Leu Glu He Gin Gin Ala Thr Thr Gly 
340 345 350 

GTC TCA CAA GAA ACC TCT GAA AAT CCT GGT AAC AAA ACA ATA GTT CCT 1104 
Val Ser Gin Glu Thr Ser Glu Asn Pro Gly Asn Lys Thr He Val Pro 
355 360 365 

GCA ACG TTA CCA CAA CTC ACC CCT ACC CTG GTG TCA CTG TTG GAG GTT 1152 
Ala Thr Leu Pro Gin Leu Thr Pro Thr Leu Val Ser Leu Leu Glu Val 
370 375 380 

ATT GAA CCT GAA GTG TTA TAT GCA GGA TAT GAT AGC TCT GTT CCA GAC 1200 
He Glu Pro Glu Val Leu Tyr Ala Gly Tyr Asp Ser Ser Val Pro Asd 
385 390 395 400 

TCA ACT TGG AGG ATC ATG ACT ACG CTC AAC ATG TTA GGA GGG CGG CAA 12-13 
Ser Thr Trp Arg He Met Thr Thr Leu Asn Met Leu Gly Gly Arg Gin 
405 410 * 415 

GTG ATT GCA GCA GTG AAA TGG GCA AAG GCA ATA CCA GGT TTC AGG AAC 1296 
Val He Ala Ala Val Lys Trp Ala Lys Ala He Pro Gly Phe Arg Asn 
420 425 430 

TTA CAC CTG GAT GAC CAA ATG ACC CTA CTG CAG TAC TCC TGG ATG TTT 134 4 

Leu His Leu Asp Asp Gin Met Thr Leu Leu Gin Tyr Ser Trp Met Phe 
435 440 " 445 

CTT ATG GCA TTT GCT CTG GGG TGG AGA TCA TAT AGA CAA TCA AGT GCA 1392 
Leu Met Ala Phe Ala Leu Gly Trp Arg Ser Tyr Arg Gin Ser Ser Ala 
450 455 460 

AAC CTG CTG TGT TTT GCT CCT GAT CTG ATT ATT AAT GAG CAG AGA ATG 14 40 

Asn Leu Leu Cys Phe Ala Pro Asp Leu He He Asn Glu Gin Arg Met 
465 470 475 480 



ACT CTA CCC TGC ATG TAC GAC CAA TGT AAA CAC ATG CTG TAT GTT TCC 
Thr Leu Pro Cys Met Tvr Asp Gin Cys Lys His Met Leu Tyr Val Ser 
485 490 495 
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TCT GAG TTA CAC AGG CTT CAG GTA TCT TAT GAA GAG TAT CTC TGT ATG 1536 
Ser Glu Leu His Arg Leu Gin Val Ser Tyr Glu Glu Tvr Leu Cys Met 
500 505 " 510 

AAA ACC TTA CTG CTT CTC TCT TCA GTT CCT AAG GAC GGT CTG AAG AGC 1584 
Lys Thr Leu Leu Leu Leu Ser Ser Val Pro Lys Asp Gly Leu Lys Ser 
515 520 525 

CAA GAG CTA TTT GAT GAA ATT AGA ATG ACC TAC ATC AAA GAG CTA GGA 1632 
Gin Glu Leu Phe Asp Glu lie Arg Met Thr Tyr lie Lys Glu Leu Gly 
530 535 540 

AAA GCC ATT GTC AAG AGG GAA GGA AAC TCC AGC CAG AAC TGG CAG CGG 1680 
Lys Ala He Val Lys Arg Glu Gly Asn Ser Ser Gin Asn Trp Gin Arg 
545 550 555 560 

TTT TAT CAA CTG ACA AAA CTC TTG GAT TCT ATG CAT GAA GTG GTT GAA 1728 
Phe Tyr Gin Leu Thr Lys Leu Leu Asp Ser Met His Glu Val Val Glu 
565 570 575 

AAT CTC CTT AAC TAT TGC TTC CAA ACA TTT TTG GAT AAG ACC ATG TCC 177 6 

Asn Leu Leu Asn Tyr Cys Phe Gin Thr Phe Leu Asp Lvs Thr Met Ser 
580 585 - 590 

ACC GAG TTC CCC GAG ATG TTA GCT GAA ATC ATC ACC AAT CAG ATA CCA 1824 
Thr Glu Phe Pro Glu Met Leu Ala Glu He He Thr Asn Gin He Pro 
595 600 605 

AAA TAT TCA AAT GGA AAT ATC AAA AAA CTT CTG TTT CAT CAA AAG GGT 1872 
Lys Tyr Ser Asn Gly Asn He Lys Lys Leu Leu Phe His Gin Lys Gly 
610 615 620 

ACC AGC CGT GGA GGG GCA TCC GTG GAG GAG ACG GAC CAA AGC CAC TTG 1920 
Thr Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gin Ser His Leu 
625 630 635 640 

GCC ACT GCG GGC TCT ACT TCA TCG CAT TCC TTG CAA AAG TAT TAC ATC 1968 
Ala Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gin Lys Tyr Tyr He 
645 650 655 

ACG GGG GAG GCA GAG GGT TTC CCT GCC ACA GTC TGA 2004 
Thr Gly Glu Ala Glu Gly Phe Pro Ala Thr Val 
660 665 



(2) INFORMATIONS POUR LA SEQ ID NO: 3 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 6094 paires de bases 

(B) TYPE: nucleotide 

(C) N OMBRE DE BRINS: simple 

{ D) CONFIGURATION: circulaire 

Ui) TYPE DE MOLECULE: ADNc 

(ix) CARACTERISTIQUE: 

(A) NOK/CLE:pCRE-LBD[GR(I747/TJ (Plasmide d'expression de la 

proteine de fusion 
Cre-LBD[GR(I747/T) J 

{B} EMPLACEMENT : 1 . .6091 
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{xi) DESCRIPTION DE LA SEQUENCE : SEQ ID NO: 3: 

GTCGACTTCT GAGGCGGAAA GAACCAGCTG TGGAATGTGT GTCAGTTAGG GTGTGGAAAG 60 

TCCCCAGGCT CCCCAGCAGG CAGAAGTATG CAAAGCATGC ATCTCAATTA GTCAGCAACC 120 

AGGTGTGGAA AGTCCCCAGG CTCCCCAGCA GGCAGAAGTA TGCAAAGCAT GCATCTCAAT 180 

TAGTCAGCAA CCATAGTCCC GCCCCTAACT CCGCCCATCC CGCCCCTAAC TCCGCCCAGT 24 0 

TCCGCCCATT CTCCGCCCCA TGGCTGACTA ATTTTTTTTA TTTA7GCAGA GGCCGAGGCC 300 

GCCTCGGCC7 CTGAGCTATT CCAGAAGTAG TGAGGAGGCT TTTTTGGAGG CCTAGGCTTT 360 

TGCAAAAAGC TGGATCGATC CTGAGAACTT CAGGGTGAGT TTGGGGACCC TTGATTGTTC 4 20 

TTTCTTTTTC GCTATTGTAA AATTCATGTT ATATGGAGGG GGCAAAGTTT TCAGGGTGTT 480 

GTTTAGAATG GGAAGATGTC CCTTGTATCA CCATGGACCC TCATGATAAT TTTGTTTCTT 54 0 

TCACTTTCTA CTCTGTTGAC AACCATTGTC TCCTCTTATT TTCTTTTCAT TTTCTG7AAC 600 

TTTTTCGTTA AACTTTAGCT TGCATTTGTA ACGAATTTTT AAATTCACTT TTGTTTATTT 660 

GTCAGATTGT AAGTACTTTC TCTAATCACT TTTTTTTCAA GGCAATCAGG GTATATTATA 720 

TTGTACTTCA GCACAGTTTT AGAGAACAAT TGTTATAATT AAATGATAAG GTAGAATATT 7 80 

TCTGCATATA AATTCTGGCT GGCGTGGAAA TATTCTTATT GGTAGAAACA ACTACATCCT 840 

GGTCATCATC C7GCCTTTCT CTTTATGGTT ACAATGATAT ACACTGTTTG AGATGAGGAT 900 

AAAATACTCT GAGTCCAAAC CGGGCCCCTC TGCTAACCAT GTTCATGCCT TCTTCTTTTT 960 

CCTACAGCTC CTGGGCAACG TGCTGGTTAT TGTGCTGTCT CATCATTTTG GCAAAGAATT 1020 

G7AATACGAC TCACTA7AGG GCGAATTCCA CCA7G7CCAA 7TTACTGACC G7ACACCAAA 1080 
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A7TTGCCTGC ATTACCGGTC GATGCAACGA GTGATGAGGT TCGCAAGAAC CTGATGGACA 1140 

TGTTCAGGGA TCGCCAGGCG TTTTCTGAGC ATACCTGGAA AATGCTTCTG TCCGTTTGCC 1200 

GGTCGTGGGC GGCATGGTGC AAGTTGAATA ACCGGAAATG GTTTCCCGCA GAACCTGAAG 1260 

ATGTTCGCGA TTATCTTCTA TATCTTCAGG CGCGCGGTCT GGCAGTAAAA ACTATCCAGC 1320 

AACATTTGGG CCAGCTAAAC ATGCTTCATC GTCGGTCCGG GCTGCCACGA CCAAGTGACA 1380 

GCAATGCTGT TTCACTGGTT ATGCGGCGGA TCCGAAAAGA AAACGTTGAT GCCGGTGAAC 14 4 0 

GTGCAAAACA GGCTCTAGCG TTCGAACGCA CTGAT7TCGA CCAGGTTCGT TCACTCATGG 1500 

AAAATAGCGA TCGCTGCCAG GATATACGTA ATCTGGCATT TCTGGGGATT GCTTATAACA 1560 

CCCTGTTACG TATAGCCGAA ATTGCCAGGA TCAGGGTTAA AGATATCTCA CGTACTGACG 1620 

GTGGGAGAAT GTTAATCCAT ATTGGCAGAA CGAAAACGCT GGT7AGCACC GCAGGTGTAG 1680 

AGAAGGCACT TAGCCTGGGG GTAACTAAAC TGGTCGAGCG ATGGATTTCC GTCTCTGGTG 17 4 0 

TAGCTGATGA TCCGAATAAC TACCTGT7TT GCCGGGTCAG AAAAAATGGT GTTGCCGCGC 1800 

CATCTGCCAC CAGCCAGC7A 7CAACTCGCG CCCTGGAAGG GA77T7TGAA GCAACTCATC 18 60 

GATTGATT7A CGGCGCTAAG GA7GACTCTG G7CAGAGA7A CC7GGCCTGG TC7GGACACA 1920 

G7GCCCG7GT CGGAGCCGCG CGAGA7ATGG CCCGCGCTGG AG77TCAATA CCGGAGATCA 1980 

TGCAAGC7GG TGGCTGGACC AATGTAAA7A TTGTCA7GAA CTA7ATCCGT AACC7GGA7A 204 0 

GTGAAACAGG GGCAATGG7G CGCCTGC7GG AAGATGGCGA TC7CGAGAT7 CAGCAGGCCA 2100 

C7ACAGGAGT C7CACAAGAA ACCTCTGAAA A7CCTGG7AA CAAAACAA7A G7TCC7GCAA 2160 

CG77ACCACA ACTCACCCCT ACCCTGG7G7 CACTG7TGGA GG77AT7GAA CC7GAAGTGT 2220 

7A7ATGCAGG ATATGA7AGC 7C7G7TCCAG ACTCAAC7TG GAGGATCA7G ACTACGCTCA 223 0 
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ACATGTTAGG AGGGCGGCAA GTGATTGCAG CAGTGAAATG GGCAAAGGCA ATACCAGGTT 234 0 

TCAGGAACTT ACACCTGGAT GACCAAATGA CCCTACTGCA GTACTCCTGG ATGTTTCTTA 24 OC 

TGGCATTTGC TCTGGGGTGG AGATCATATA GACAATCAAG TGCAAACCTG CTGTGTTTTG 24 60 

CTCCTGATCT GATTATTAAT GAGCAGAGAA TGACTCTACC CTGCATGTAC GACCAATGTA 2520 

AACACATGCT GTATGTTTCC TCTGAGTTAC ACAGGCTTCA GGTATCTTA? GAAGAGTATC 2580 

TCTGTATGAA AACCTTACTG CTTCTCTCTT CAGTTCCTAA GGACGGTCTG AAGAGCCAAG 264 0 

AGCTATTTGA TGAAATTAGA ATGACCTACA TCAAAGAGCT AGGAAAAGCC ATTGTCAAGA 2 7 CO 

GGGAAGGAAA CTCCAGCCAG AACTGGCAGC GGTTTTATCA ACTGACAAAA CTCTTGGATT 2760 

CTATGCATGA AGTGGTTGAA AATCTCCTTA ACTATTGCTT CCAAACATTT TTGGATAAGA 2820 

CCATGTCCAC CGAGTTCCCC GAGATGTTAG CTGAAATCAT CACCAATCAG ATACCAAAAT 2880 

ATTCAAATGG AAATATCAAA AAACTTCTGT TTCATCAAAA GGGTACCAGC CGTGGAGGGG 294 0 

CATCCGTGGA GGAGACGGAC CAAAGCCACT TGGCCACTGC GGGCTCTACT TCATCGCATT 3000 

CCTTGCAAAA GTATTACATC ACGGGGGAGG CAGAGGGTTT CCCTGCCACA GTCTGAGAGC 3060 

TCCCTGGAAT TCGGATCTTA TTAAAGCAGA ACTTGTTTAT TGCAGCTTAT AATGGTTACA 3120 

AATAAAGCAA TAGCATCACA AATTTCACAA ATAAAGCATT TTTTTCACTG CATTCTAGTT 3180 

GTGGTTTGTC CAAACTCATC AATGTATCTT ATCATGTCTG GTCGACTCTA GACTCTTCCG 3240 

CTTCCTCGCT CACTGACTCG CTGCGCTCGG TCGTTCGGCT GCGGCGAGCG GTATCAGCTC 3300 

ACTCAAAGGC GGTAATACGG TTATCCACAG AATCAGGGGA TAACGCAGGA AAGAACATGT 3360 

GAGCAAAAGG CCAGCAAAAG GCCAGGAACC GTAAAAAGGC CGCGTTGCTG GCGTTTTTCC 34 20 

ATAGGCTCCG CCCCCCTGAC GAGCATCACA AAAATCGACG CTCAAGTCAG AGGTGGCGAA 34 80 
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ACCCGACAGG ACTATAAAGA TACCAGGCGT TTCCCCCTGG AAGCTCCCTC GTGCGCTCTC 354 0 

CTGTTCCGAC CCTGCCGCTT ACCGGATACC TGTCCGCCTT TCTCCCTTCG GGAAGCGTGG 3600 

CGCTTTCTCA TAGCTCACGC TGTAGGTATC TCAGTTCGGT GTAGGTCGTT CGCTCCAAGC 3660 

TGGGCTGTGT GCACGAACCC CCCGTTCAGC CCGACCGCTG CGCCTTATCC GGTAACTATC 3720 

GTCTTGAGTC CAACCCGGTA AGACACGACT TATCGCCACT GGCAGCAGCC ACTGGTAACA 37 80 

GGATTAGCAG AGCGAGGTAT GTAGGCGGTG CTACAGAGTT CTTGAAGTGG TGGCCTAACT 384 0 

ACGGCTACAC TAGAAGGACA GTATTTGGTA TCTGCGCTCT GCTGAAGCCA GTTACCTTCG 3900 

GAAAAAGAGT TGGTAGCTCT TGATCCGGCA AACAAACCAC CGCTGGTAGC GGTGGTTTTT 3960 

T7GTTTGCAA GCAGCAGATT ACGCGCAGAA AAAAAGGATC TCAAGAAGAT CCTTTGATCT 4020 

TTTCTACGGG GTCTGACGCT CAGTGGAACG AAAACTCACG TTAAGGGATT TTGGTCATGA 4080 

GATTATCAAA AAGGATCTTC ACCTAGATCC TTTTAAATTA AAAATGAAGT TTTAAATCAA 414 0 

TCTAAAGTAT ATATGAGTAA ACTTGGTCTG ACAGTTACCA ATGCTTAATC AGTGAGGCAC 4 200 

CTATCTCAGC GATCTGTCTA TTTCGTTCAT CCATAGTTGC CTGACTCCCC GTCGTGTAGA 4 260 

TAACTACGAT ACGGGAGGGC TTACCATCTG GCCCCAGTGC TGCAATGATA CCGCGAGACC 4 320 

CACGCTCACC GGCTCCAGAT TTATCAGCAA TAAACCAGCC AGCCGGAAGG GCCGAGCGCA 4 380 

GAAGTGGTCC TGCAACTTTA TCCGCCTCCA TCCAGTCTAT TAATTGTTGC CGGGAAGCTA 4 4 40 

GAGTAAGTAG TTCGCCAGTT AATAGTTTGC GCAACGTTGT TGCCATTGCT ACAGGCATCG 4 500 

TGGTGTCACG CTCG7CGTTT GGTATGGCTT CATTCAGCTC CGGTTCCCAA CGATCAAGGC 4 560 

GAGTTACATG A7CCCCCATG TTGTGCAAAA AAGCGGTTAG CTCCTTCGGT CCTCCGATCG 4 620 

TTGTCAGA^.G TAAG77GGCC GCAGTGTTAT CACTCATGGT TATGGCAGCA CTGCATAATT 4 690 
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CTCTTACTGT CATGCCATCC 
CATTCTGAGA ATAGTGTATG 
ATACCGCGCC ACATAGCAGA 
GAAAACTCTC AAGGATCTTA 
CCAACTGATC TTCAGCATCT 
GGCAAAATGC CGCAAAAAAG 
TCCTTTTTCA ATATTATTGA 
TTGAATGTAT TTAGAAAAAT 
CACCTGACGT CTAAGAAACC 
CGAGGCCCCT TTCGTCTCGC 
CTCCCGGAGA CGGTCACAGC 
GGCGCGTCAG CGGGTGTTGG 
ATTGTACTGA GAGTGCACCA 
TACCGCATCA GGAAATTGTA 
AAATCAGCTC ATTTTTTAAC 
AATAGACCGA GATAGGGTTG 
ACGTGGACTC CAACGTCAAA 
AACCATCACC CTAATCAAGT 
CTAAAGGGAG CCCCCGATTT 
AAGGGAAGAA AGCGAAAGGA 
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GTAAGATGCT TTTCTGTGAC 
CGGCGACCGA GTTGCTCTTG 
ACTTTAAAAG TGCTCATCAT 
CCGCTGTTGA GATCCAGTTC 
TTTACTTTCA CCAGCGTTTC 
GGAATAAGGG CGACACGGAA 
AGCATTTATC AGGGTTATTG 
AAACAAATAG GGGTTCCGCG 
ATTATTATCA TGACATTAAC 
GCGTTTCGGT GATGACGGTG 
TTGTCTGTAA GCGGATGCCG 
CGGGTGTCGG GGCTGGCTTA 
TATGCGGTGT GAAATACCGC 
AACGTTAATA TTTTGTTAAA 
CAATAGGCCG AAATCGGCAA 
AGTGTTGTTC CAGTTTGGAA 
GGGCGAAAAA CCGTCTATCA 
TTTTTGGGGT CGAGGTGCCG 
AGAGCTTGAC GGGGAAAGCC 
GCGGGCGCTA GGGCGCTGGC 
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TGGTGAGTAC TCAACCAAGT 4740 

CCCGGCGTCA ATACGGGATA 4 800 

TGGAAAACGT TCTTCGGGGC 4 8 60 

GATGTAACCC ACTCGTGCAC 4 920 

TGGGTGAGCA AAAACAGGAA 4 980 

ATGTTGAATA CTCATACTCT 504 0 

TCTCATGAGC GGATACATAT 5100 

CACATTTCCC CGAAAAGTGC 5160 

CTATAAAAAT AGGCGTATCA 5220 

AAAACCTCTG ACACATGCAG 5280 

GGAGCAGACA AGCCCGTCAG 534 0 

ACTATGCGGC ATCAGAGCAG 54 00 

ACAGATGCGT AAGGAGAAAA 54 60 

ATTCGCGTTA AATTTTTGTT 5520 

AATCCCTTAT AAATCAAAAG 5580 

CAAGAGTCCA CTATTAAAGA 564 0 

GGGCGATGGC CCACTACGTG 5700 

TAAAGCACTA AATCGGAACC 57 60 

GGCGAACGTG GCGAGAAAGG 58 20 

AAGTGTAGCG GTCACGCTGC 58 80 
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GCGTAACCAC CACACCCGCC GCGCTTAATG CGCCGCTACA GGGCGCGTCG CGCCATTCGC 594 0 

CATTCAGGCT GCGCAACTGT TGGGAAGGGC GATCGGTGCG GGCCTCTTCG CTATTACGCC 6000 

AGCTGGCGAA AGGGGGATGT GCTGCAAGGC GATTAAGTTG GGTAACGCCA GGGTTTTCCC 6060 

AGTCACGACG 7TGTAAAACG ACGGCCAGTG AATT e09A 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 36 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genornique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: SG52 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 
CTGGAAGATG GCGATCTCGA GATTCAGCAG GCCACT 36 
(2) INFORMATIONS POUR LA SEQ ID NO: 5: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 37 paires de bases 

(B) TYPE: nucleotide 

<C) NOMBRE DE BRINS: simple 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genornique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: SG53 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 5: 
CTGTTTCATC AAAAGGGTAC CAGCCGTGGA GGGGCAT 37 
(2) INFORMATIONS POUR LA SEQ ID NO: 6: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genornique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligonucleotide synthetique 
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(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 6: 
ATTATTATTA CTCGAGTGAT GATG 2 4 

(2) INFORMATIONS POUR LA SEQ ID NO: 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 24 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

Mil) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: oligonucleotide synthetique 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 7: 
ATCATCATCA TCCGAGTAAT AATA 
(2) INFORMATIONS POUR LA SEQ ID NO: 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 14 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 
<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: SB211 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

GGCAAACACT ATGG 

(2) INFORMATIONS POUR LA SEQ ID NO: 9: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 17 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: PZ105 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 9: 
TTGCGTACTG TCCTCTT 

(2) INFORMATIONS POUR LA SEQ ID NO: 10: 



17 



WO 97/31108 



6! 



(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) N OMB RE DE BRINS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligonucleotide synthetique 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10 
AAGAAGCCCT TGCAGCCCTC 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 40 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: oligonucleotide synthetique 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
AATTATAACT TCGTATAATG TATGCTATAC GAAGTTATTC 



(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 20 paires de bases 
(3) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

( ix) CARACTERISTIQUE : 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
ATCCGAAAAG AAAACGTTGA 

(2) INFORMATIONS POUR LA SEQ ID NO: 13: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 20 paires de bases 
(3) TYPE: nucleotide 
(C) NOMBRE DE BRINS: simple 
CD) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 
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(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 13: 



ATCCAGGTTA CGGATATAGT 



20 



{2} INFORMATIONS POUR LA SEQ ID NO: 14: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 14: 
GGTTCTCCGG CCGCTTGGGT 20 
(2) INFORMATIONS POUR LA SEQ ID NO: 15: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 15: 
GAAGGCGATG CGCTGCGAAT 20 
(2) INFORMATIONS POUR LA SEQ ID NO: 16: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 20 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce A 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 16: 
CAAGGAGCCT CCTTTCTCTA 
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(2) INFORMATIONS POUR LA SEQ ID NO: 17: 

(i) CARACTERISTIQUES DE LA SEQUENCE : 

(A) LONGUEUR: 20 paires de base* 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN (genomique) 

(ix) CARACTERISTIQUE: 

(A) NOM/CLE: amorce B 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 17: 
CCTGCTCTAC CTGGTGACTT 



20 
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REVINDICATIONS 

1. Fragment d'ADN codant pour un recepteur nucleaire de 
glucocorticoides modifie, notamment mute dans la region codant pour le 

5 domaine de liaison du ligand, de sorte que 1'activite dudit recepteur est 
inductible plus fortement par un ligand glucocorticoide synthetique que 
par un ligand glucocorticoide naturel. 

2. Fragment d'ADN codant pour le recepteur nucleaire des 
10 glucocorticoides sauvage avec une mutation isoleucine --> threonine 

situee entre les helices Hll et H12 de la sequence d'acides amines dudit 
recepteur. 

3. Fragment d'ADN selon la revendication 2, caracterise en ce qu'il a 
15 pour sequence, une sequence codant pour le recepteur nucleaire humain 

des glucocorticoides dont la sequence en acides amines est 
substantiellement telle que representee dans 1'IDS n°l. 

4. Fragment d'ADN selon la revendication 3, caracterise en ce qu'il a 
20 pour sequence la sequence de l'ADNc du recepteur nucleaire humain des 

glucocorticoides substantiellement telle que representee dans 1'IDS n° 1 

5. Fragment d'ADN codant pour un domaine dc liaison du ligand 
(LBD) d'un recepteur nucleaire des glucocorticoides comportant une 

25 modification, notamment une mutation de sortc que 1'activite dudit 
domaine de liaison du ligand est inductible plus fortement par liaison a un 
ligand glucocorticoide synthetique que par liaison a un glucocorticoide 
naturel. 

30 6. Fragment d'ADN codant pour le domaine de liaison du ligand 

(LBD) du recepteur nucleaire humain des glucocorticoides naturel avec 
une mutation isoleucine --> threonine en position correspondant a la 
position 747 de la sequence en acides amines dudit recepteur complet. 



35 



WO 97/31108 



PCT/FR97/00315 



65 

7. Fragment d'ADN codant pour le domaine de liaison du ligand du 
recepteur nucieaire humain des glucocorticoides selon la revendication 6, 
caracterise en ce qu'il a pour sequence, une sequence codant pour les 
acides amines du domaine de liaison du ligand du recepteur nucieaire 
humain des glucocorticoides dont la sequence en acides amines est 
substantiellement telle que representee dans 1'IDS n° 1 de l'acide amine 
532 a l'acide amine 777. 



8. Fragment d'ADN selon la revendication 7, caracterise en ce qu'il a 
pour sequence la sequence codant pour le domaine de liaison du ligand 
(LBD) du recepteur nucieaire humain des glucocorticoides 
substantiellement telle que representee dans 1*1DS n° 1 du codon 532 au 
codon 777. 



9. Recepteur nucieaire des glucocorticoides modifie, notamment 
mute dans la region du domaine de liaison du ligand, de sorte que l'activite 
dudit recepteur est inductible plus fortement par un ligand 
glucocorticoide synthetique que par un ligand glucocorticoide naturel. 

10. Recepteur selon la revendication 9, caracterise en ce qu'il a 
pour sequence, la sequence en acides amines du recepteur nucieaire 
humain des glucocorticoides sauvage avec une mutation isoleucine --> 
threonine situee entre les helices Ml et HI 2. 

11. Recepteur nucieaire humain des glucocorticoides selon la 
revendication 10, caracterise en ce qu'il a pour sequence en acides 
amines, une sequence substantiellement telle que representee dans 1'IDS 
n°l. 



12. Domaine de liaison du ligand du recepteur nucieaire des 
glucocorticoides selon I'une des revendications 9 a 11. 
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13. Domaine de liaison du ligand du recepteur nucleaire humain des 
glucocorticoids LBD [GR(I747/T)], caracterise en ce qu'il a pour sequence, 
la sequence en acides amines du domaine de liaison du ligand du recepteur 
des glucocorticoides humain substantiellement telle que representee dans 
1'IDS n° 1 de l'acide amine 532 a l'acide amine 777. 

14. Systeme vectoriel d'expression conditionnelle d'une proteine 
notamment une proteine etrangere dans des cellules notes comportant un 
element de controle de la transcription inductible par un complexe forme 
par un recepteur nucleaire des glucocorticoides et un ligand, caracterise 

en ce qu'il comprend : 

- un premier fragment d'ADN consistant en un fragment d'ADN 
codant pour ladite proteine sous le controle d'elements assurant son 
expression dans lesdites cellules notes, lesdits elements assurant son 
expression comprenant une sequence de controle de transcription 
(RE) inductible par le recepteur selon Tune des revindications 9 a 
11, complexe a un ligand glucocorticoide synthetique, et 

- un deuxieme fragment d'ADN consistant en un fragment d'ADN 
fonctionnel codant pour ledit recepteur selon l'une des 
revendications 1 a 4 ou seulement une partie dudit fragment 
comprenant la region qui reconnait le ligand (LBD) selon l'une des 
revendications 5 a 8, et la region de liaison a l'ADN (DBD) qui se fixe 
sur ladite sequence de controle de la transcription (RE), 

- lesdits premier et deuxieme fragments d'ADN pouvant etre portes 
par un meme vecteur ou deux vecteurs separement. 

15. Systeme vectoriel selon la revendication 14, caracterise en ce 
qu'il comporte l'ADNc codant pour : 

- la region LBD, representee par des codons codant les acides amines 
n° 532 a 777 dans 1'IDS n" 1, et 

- la region DBD, representee par des codons codant les acides amines 
n° 421 a 487 dans 1'IDS n' 1. 
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16. Systeme vectoriel selon la revendication 14, caracterise en ce 
qu'on remplace la sequence codant pour le domaine de liaison a 1'ADN 
(DBD) du recepteur des glucocorticoides par celle d'un autre 
transactivateur, notamment celui de la proteine de levure Gal 4 et on 
remplace la sequence de controle de transcription (RE) du recepteur des 
glucocorticoides par celle reconnue par ledit autre transactivateur, 
notamment la sequence 17m reconnue par le transactivateur Gal 4. 

17. Procede depression d'une proteine etrangere dans des cellules 
humaines ou animales notamment de mammiferes, caracterise en ce que 
Ton cultive des cellules qui contiennent un systeme vectoriel selon Tune 
des revindications 14 a 16, et en cc qu'on ajoute ledit ligand synthetique, 
dans le milieu de culture, puis on recupere la proteine synthetisee. 

18. Procede selon la revendication 17, caracterise en ce que ledit 
ligand synthetique est choisi parmi la dexamethasone, le triamcinolone 
acetonide, le RU2836, le bimetrazole, le deacylcortivazoi et le fluocinolone 
acetonide. 



19. Gene de fusion comprenant un fragment d'ADN selon I'une des 
revindications 1 a 8 et un fragment d'ADN codant pour une proteine dont 
on veut reguler l'activite, ladite activite etant inductible plus fortement 
par liaison dudit recepteur ou dudit domaine de liaison du ligand du 
recepteur avec undit ligand glucocorticoide synthetique qu'avec un 
ligand glucocorticoide naturel, lorsque ladite proteine se trouve fusionnee 
audit recepteur ou audit domaine de liaison du ligand dudit recepteur. 

20. Gene de fusion selon la revendication 19, caracterise en ce que 
ladite proteine est une proteine recombinase. 

21. Gene de fusion selon la revendication 20, caracterise en ce que 
ladite proteine est une recombinase de la famille des integrases x_ 

22. Gene de fusion selon la revendication 21, caracterise en ce que la 
proteine recombinase est la recombinase Cre du bacteriophage P x . 
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23. Gene de fusion selon la revendication 22, comprenant un 
fragment d'ADN codant pour la proteine recombinase Cre du 
bacteriophage P lf et le fragment d'ADN codant pour le domaine de liaison 
du ligand du recepteur nucleaire humain des glucocorticoides modifie 
selon Tune des revendications 5 ou 8. 

24. Gene de fusion selon la revendication 23, comprenant dans le 
sens 5' ~> 3' : 

- un fragment d'ADN codant pour la recombinase Cre du 
bacteriophage Pi ; 

- un fragment d'ADN codant pour tout ou partie de la region 
charniere D du recepteur nucleaire des glucocorticoides, region 
situee entre le domaine DBD et le domaine LBD, et 

- le fragment d'ADN codant pour le domaine de liaison du ligand 
(LBD) modifie, notamment mute, du recepteur nucleaire des 
glucocorticoides selon Tune des revendications 5 ou 8. 

25. Gene de fusion selon la revendication 24, caracterise en ce qu'il 
a pour sequence une sequence codant pour les acides amines de 1'IDS n" 2 
comprenant : 

- les acides amines 1 a 343 qui correspondent a la recombinase Cre ; 

- les acides amines 346 a 377 qui correspondent a la region C- 
terminale de la region D du recepteur humain des glucocorticoides; 

- les acides amines 378 a 623 qui correspondent au LBD [GR(I747/T)]. 

26. Gene de fusion selon la revendication 25, caracterise en cc qu'il 
a substantiellement la sequence Cre-LBD(GR(I747/T)] telle que representee 
dans 1'IDS n' 2 dont les acides amines 626 a 667 correspondent a la region F 
du recepteur humain des oestrogenes. 

27. Vecteur d'expression de la proteine de fusion codee par le gene 
de fusion selon Tune des revendications 19 a 26 dans des cellules notes 
animales notamment de mammiferes, caracterise en ce qu'il comporte le 
gene de fusion selon 1'une des revendications 19 a 26, place sous le 
controle d'elements d'expression assurant son expression dans lesditcs 
cellules hotes. 
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28. Proteine de fusion comprenant un recepteur selon Tunc des 
revendications 9 a 11 ou un domaine de liaison du ligand selon Tune des 
revendications 12 ou 13 et une proteine dont 1'activite est inductible plus 
fortement par liaison dudit recepteur ou dudit domaine de liaison du ligand 
(LBD) avec undit ligand glucocorticoide synthetique qu'avec un ligand 
glucocorticoide naturel. 

29. Proteine de fusion selon la revendication 28, caractdris^e en ce 
que la proteine est une proteine recombinase. 

30. Proteine de fusion selon la revendication 28, caracterisee en ce 
que la proteine est une proteine recombinase de la famille des 
integrases \. 

31. Proteine de fusion selon la revendication 30, caracterisee en ce 
que la recombinase est la proteine Cre du bacteriophage Pj. 

32. Proteine de fusion selon la revendication 31, comportant en 
outre la partie C- terminale de la region charniere D du recepteur 
nucleaire humain des glucocorticoides, intercalee entre la proteine Cre et 
ledit domaine dc liaison du ligand du recepteur modifie selon Tune des 
revendications 12 ou 13. 

33. Procede de recombinaison, notamment, d'excision, insertion, 
inversion ou translocation conditionnelle au niveau d'un fragment d'ADN 
contenant un ou deux sites de reconnaissance specifique d'une proteine 
recombinase dans des cellules hotes animales, caracterise en ce qu'il 
comporte les etapes dans lesquelles : 

1) on introduit une proteine de fusion selon Tune des 
revendications 29 a 32 ou un vecteur depression de ladite proteine 
de fusion selon la revendication 27 dans lesdites cellules hotes dans 
des conditions permettant Pexpression d'une proteine dc fusion 
selon Tune des revendications 29 & 32 et, 

2) on complexc ladite proteine de fusion avec ledit ligand 
glucocorticoide synthetique, cn mettant ledit ligand en presence 
desdites cellules hotes. 
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34. Procede de deletion conditionnelle d'un fragment d'ADN dans un 
gene dans lequel on met en oeuvre un procedd d'excision selon la 
revendication 33, et dans lequel ledit fragment d'ADN a exciser est integre 
entre deux sites de reconnaissance de proteine recombinase orientes en 

5 repetition directe. 

35. Procede selon Tune des revendications 33 ou 34, caracterise en 
ce que lesdits sites de reconnaissance specifique de proteine recombinase 
sont les sites loxP et ladite proteine recombinase est la proteine Cre du 

10 bacteriophage Pi. 

36. Procede selon Pune des revendications 33 a 35, caracterise en ce 
que ledit fragment d'ADN que Ton veut exciser et lesdits sites de 
reconnaissance specifiques d'une proline recombinase sont portes par 

15 un vecteur plasmidique ou viral, ou integres dans un chromosome des 
cellules hdtes. 

37. Procede selon Pune des revendications 33 h 36, caracterise en ce 
que Pintegration des sites de reconnaissance specifique de la proteine 

20 recombinase, notamment du ou des sites loxP, se fait par recombinaison 
homologue du g£ne comportant ledit fragment d'ADN a inserer ou 
transloquer ou respectivement a exciser ou invcrser avec undit gfcne 
modifie comportant ledit fragment d'ADN flanquc en 5' et/ou 3' par le ou 
lesdit(s) site(s) de reconnaissance de recombinase, notamment site(s) loxP. 

25 

38. Vecteur de transfert d'un fragment d'ADN dans des cellules holes 
humaines ou animales, notamment mammiferes, caracterise en ce qu'il 
comporte undit fragment d'ADN a transferer comprenant des sites de 
reconnaissance specifiques de la recombinase, notamment deux sites loxP 

30 orientes a repetition directe et une cassette d'expression d'un gene de 
fusion selon Pune des revendications 19 a 26. 
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39. Vecteur selon la revendication 38, caracterise en ce que le gene 
de fusion est place sous le controle d'elements d'expression specifiques des 
cellules hotes. 

40. Vecteur selon la revendication 39, caracterise en ce qu'il 
comporte la sequence du plasmide pCre-LBD[GR(I747/T)] de TIDS n° 3. 

41. Procede selon Tune des revendications 33 £ 37, caracterise en ce 
que ledit fragment d'ADN k exciser a et£ transfere, notamment integrc 
dans le chromosome desdites cellules, a I'aide d'un vecteur de transfert 
selon la revendication 38. 

42. Vecteur selon la revendication 27 ou 38 pour une utilisation 
comme medicament en therapie genique en combinaison avec un ligand 
glucocorticoide synthetique, notamment la dexamethasone. 

43. Cellule humaine ou animale, notamment de mammiferes 
transfectee par un vecteur d'expression d'une proteine de fusion selon la 
revendication 27. 

44. Cellule humaine ou animale, dans laquelle un fragment d'ADN a 
ete transfere a 1'aide d'un vecteur, selon Tune des revendications 38 ou 39. 

45. Cellule animale, notamment de mammiferes exprimant de faqon 
constitutive la proteine de fusion selon Tune des revendications 28 a 32. 

46. Animal transgenique, notamment souris, comportant un gene 
fonctionnel de la proteine de fusion selon Tune des revendications 28 a 32 
notamment integre dans un de ses chromosomes. 
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47. Animal transgenique selon la revindication 46 dans lequel un 
gene d'interet est modifie par insertion de un ou plusieurs site(s) loxP, 
notamment im£gre(s) dans un ou plusieurs de ses chromosomes. 

5 48. Utilisation d'un vecteur, de cellules ou d'un animal selon Tune 

des revendications 45 a 47, comme outil d'analyse ou etude de 
fonctionnement d'un gene donne d'une cellule hote. 

49. Methode de traitement des cellules ex vivo ou in vitro impliquant 
10 la mise en oeuvre d'un procede selon Tune des revendications 33 a 37 ou 41 
et Tutilisation d'un vecteur selon la revendication 42. 
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representation schematique du plasmide pCre-LBD[GR(l747/T)) 

Les sequences codant pour Cre sont representees par ggggg 

pour les aa 500-777 de hGR(l747/T) par X777. 
pour les aa 553-595 de hER par [fififl 
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Sail 

1 GTCGACTTCT GAGGCGGAAA GAACCAGCTG TGGAATGTGT GTCAGTTAGG 
51 GTGTGGAAAG TCCCCAGGCT CCCCAGCAGG CAGAAGTATG CAAAGCATGC 
101 ATCTCAATTA GTCAGCAACC AGGTGTGGAA AGTCCCCAGG CTCCCCAGCA 
151 GGCAGAAGTA TGCAAAGCAT GCATCTCAAT TAGTCAGCAA CCATAGTCCC 
201 GCCCCTAACT CCGCCCATCC CGCCCCTAAC TCCGCCCAGT TCCGCCCATT 
251 CTCCGCCCCA TGGCTGACTA ATTTTTTTTA TTTATGCAGA GGCCGAGGCC 
301 GCCTCGGCCT CTGAGCTATT CCAGAAGTAG TGAGGAGGCT TTTTTGGAGG 
351 CCTAGGCTTT TGCAAAAAGC TGGATCGATC CTGAGAACTT CAGGGTG^GT 
401 TTGGGGACCC TTGATTGTTC TTTCTTTTTC GCTATTGTAA AATTCATGTT 
451 ATATGGAGGG GGCAAAGTTT TCAGGGTGTT GTTTAGAATG GGAAGATGTC 
501 CCTTGTATCA CCATGGACCC TCATGATAAT TTTGTTTCTT TCACTTTCTA 
551 < ^ CTGTTGAC AACCATTGTC TCCTCTTATT TTCTTTTCAT TTTCTGTAAC 
601 TTTTTCGTTA AACTTTAGCT TGCATTTGTA ACGAATTTTT AAATTCACTT 
651 TTGTTTATTT GTCAGATTGT AAGTACTTTC TCTAATCACT TTTTTTTCAA 
701 GGCAATCAGG GTATATTATA TTGTACTTCA GCACAGTTTT AGAGAACAAT 
751 TGTTATAATT AAATGATAAG GTAGAATATT TCTGCATATA AATTCTGGCT 
801 GGCGTGGAAA TATTCTTATT GGTAGAAACA ACTACATCCT GGTCATGATC 
851 CTGCCTTTCT CTTTATGGTT ACAATGATAT ACACTGTTTG AGATGAGGAT 
901 AAAA TACTCT GAGTCCAAAC CGGGCCCCTC TGCTAACCAT GTTCATGCCT 
951 TCTTCTTTTT CCTACAGCTC CTGGGCAACG TGCTGGTTAT TGTGCTGTCT 
„„„ EcoRI 
1001 CATCATTTTG GCAAAGAATT GTAATACGAC TCACTATAGG GCGAATTCCA 
1051 CC ATG TCC AAT TTA CTG ACC GTA CAC CAA AAT TTG CCT GCA 
l*Met Ser Asn Leu Leu Thr Val His Gin Asn Leu Pro Ala 
1092 TTA CCG GTC GAT GCA ACG AGT GAT GAG GTT CGC AAG AAC CTG 
14 ►Leu Pro Val Asp Ala Thr Ser Asp Gl u Val A rg Lys Asn Leu 
1134 ATG GAC ATG TTC AGG GAT CGC CAG GCG TTT TCT GAG CAT ACC 
28^Met Asp Met Phe Arg Asp A rg Gin Ala Pho Ser Gl u His Thr 
1176 TGG AAA ATG CTT CTG TCC GTT TCC CGG TCC TCG GCC GCA TGG 
42>Trp Lys Met Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp 
1218 TGC AAG TTG AAT AAC CGG AAA TGG TTT CCC GCA GAA CCT GAA 
56^Cys Lys Leu Asn Asn Arg Lys Trp Phe Pro Ala Gl u Pro Gl u 
1260 GAT GTT CGC GAT TAT CTT CTA TAT CTT CAG GCG CGC GGT CTG 
70>Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gin Ala Arg Gl y Leu 
1302 GCA GTA AAA ACT ATC CAG CAA CAT TTG GGC CAG CTA AAC ATG 
84>Ala Val Lys Thr I I e Gl n Gl n His Leu Gl y Gin Leu Asn Mei 
1344 CTT CAT CGT CGG TCC GGG CTG CCA CGA CCA AGT GAC ACC AAT 
98>Leu His Arg Arg Ser Gl y Leu Pro Arg Pro Ser Aso Ser Asn 
1385 GCT GTT TCA CTG GTT ATG CGG CGG ATC CGA .AAA GAA AAC GTT 
112»Ala Val Ser Leu Val Met Arg Arg lie Arg Lys Gl u Asn Val 
1428 CAT GCC GGT GAA CGT GCA AAA CAG GCT CTA GCG TTC CAA CGC 
126>Asp Ala Gl y Gl u Arg Ala Lys Gin Ala Leu Ala Pho Gl u Arg 
1470 ACT GAT TTC GAC CAG GTT CGT TCA CTC ATG GAA AAT AGC CAT 
140>Thr Asp Phe Asp Gin Val Arg Ser Leu Met Gl u Asn Ser Asp 
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1512 CGC TGC CAG GAT ATA CGT AAT CTG GCA TTT CTG GGG ATT GCT 
154>Arg Cys Gin Asp lie A rg Asn Leu Ala Phe Leu Gly lie Ala 
1554 TAT AAC ACC CTG TTA CGT ATA GCC GAA ATT GCC AGG ATC AGG 
168>Tyr Asn Thr Leu Leu A rg Me Ala Gl u lie Ala A rg lie A rg 
1596 GTT AAA GAT ATC TCA CGT ACT GAC GGT GGG AGA ATG TTA ATC 
182 ► Val Lys Asp lie Ser A rg Thr Asp Gl y Gl y A rg Mel Leu lie 
1638 CAT ATT GGC AGA ACG AAA ACG CTG GTT AGC ACC CCA GGT GTA 
'l96>His lie Gl y A rg Thr Lys Thr Leu Val Ser Thr Ala Gl y Va.' 
1680 GAG AAG OCA CTT AGC CTG GGG GTA ACT AAA CTG CTC GAG CGA 
210>Glu Lys Ala Leu Ser Leu Gl y Val Thr Lys Leu Val Gl u A rg 
1722 TGG ATT TCC GTC TCT GGT GTA GCT GAT GAT CCG AAT AAC TAC 
224>Trp lie Ser Val Ser Gl y Val Ala Asp Asp Pro Asn Asn Tyr 
1764 CTG TTT TGC CGG GTC AGA AAA AAT GGT GTT GCC GGG CCA TCT 
238>Leu Phe Cys A rg Val A rg Lys Asn Gl y Val Ala Ala Pro Ser 
1806 GCC ACC AGC CAG. CTA TCA ACT CGC GCC CTG GAA GGG ATT TTT 
2S2>Ala Thr Ser Gin Leu Ser Thr A rg Ala Leu Gl u Gl y lie Phe 
1848 GAA GCA ACT CAT CGA TTG ATT TAC GGC GCT AAG GAT GAC TCT 
266^Glu Ala Thr His A rg Leu Me Tyr Gl y Ala Lys Asp Asp Ser 
1890 GGT CAG AGA TAC CTG GCC TGG TCT GGA CAC ACT GCC CGT GTC 
280^Gly Gin Arg Tyr Leu Ala Trp Ser Gl y His Ser Ala A rg Val 
1932 GGA GCC GCG CGA GAT ATG GCC CGC GCT GGA GTT TCA ATA CCG 
294>Gly Ala Ala Arg Asp Met Ala Arg Ala Gl y Val Ser Me Pro 
1974 GAG ATC ATG CAA GCT GCT GGC TGG ACC AAT GTA AAT ATT GTC 
308>Glu I le Met Gin Ala Gly Gly Trp Thr Asn Val Asn lie Val 
2016 ATG AAC TAT ATC CGT AAC CTG GAT ACT GAA ACA GGG GCA ATG 
322»"Met Asn lyr Me Arg Asn Leu Asp Ser Gl u Thr Gly Ala Me I 
.... Xhol 

2058 GTC CGC CTG CTG GAA GAT GGC GAT CTC GAG ATT CAG C^G GCC 
336> Val Arg Leu Leu Gl u Asp Gly Asp Leu Gl u I I e Gl n Gl n Al a 

2100 ACT ACA GGA GTC TCA CAA GAA ACC TCT GAA AAT CCT GCT AAC 
350>Thr Thr Gly Val Ser Gin Gl u Thr Ser Gl u Asn Pro Gly Asn 

2142 AAA ACA ATA GTT CCT GCA ACG TTA CCA CAA CTC ACC CCT ACC 
364> Lys Thr lie Val Pro Ala Thr Leu Pro Gin Leu Thr Pro Thr 

InL ^ GTC ^ CTC m GAG GTP ATT CCT GTC TTA TAT 

378> Leu Val Ser Leu Leu Gl u Val Me Gl u Pro Gl u Val Leu Tyr 

2226 GCA GGA TAT GAT AGC TCT GTT CCA GAC TCA ACT TGG AGG ATC 

392> Ala Gly Tyr Asp Ser Ser Val Pro Asp Ser Thr Trp Arg Me 

2268 ATG ACT ACG CTC AAC ATG TTA GGA GGG CGG CAA CTG ATT GCA 

406> Met Thr Thr Leu Asn Met Leu Gly Gly Arg Gin Val Me Ala 

2 ?J° ^ GTG AAA TGG GGA AAG GCA ATA CCA GCT TTC AGG AAC TTA 

420»Ala Val Lys Trp Ala Lys Ala Ma Pro Gly Phe Arg Asn Leu 

IIL Ci " C CTG GAT GAC ^ ATG ACC CTA CTG CAG TAC TCC TGG ATG 

434»>H.s Leu Asp Asp Gin Met Thr Leu Leu Gin Tyr Ser Trp Met 
2394 TTT CTT ATG GGA TTT GCT CTG GGG TGG AGA TCA TAT AGA CAA 

448> Phe Leu Met Ala Phe Ala Leu Gly Trp Arg Ser Tyr Arg Gin 
2436 TCA ACT GCA AAC CTG CTG TCT TTT GCT CCT GAT CTG ATT ATT 

462> Ser Ser Ala Asn Leu Leu Cys Phe Ala Pro Asp Lou Me Me 
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2478 AAT GAG CAG AGA ATG ACT CTA CCC TGC ATG TAG GAC CAA TGT 

476>Asn Gl u Gin A rg Met Thr Leu Pro Cys Mat Tyr Asp G! n Cys 
2520 AAA CAC ATG CTC TAT GTT TCC TCT GAG TTA CAC AGG CTT CAG 

490>Lys His Met Leu Tyr Va I Sor Ser Gl u Lou His A rg Leu Gin 
2562 GTA TCT TAT GAA GAG TAT CTC TGT ATG AAA ACC TTA CTG CTT 

504>Val Ser Tyr Gl u Gl u Tyr Leu Cys Mel Lys Thr Leu Leu Leu 
2604 CTC TCT TCA GTT CCT AAG GAC GGT CTG AAG AGC C.AA GAG CTA 

518^ Leu Ser Ser Val Pro Lys Asp Gi y Leu Lys Ser Gin Gl u Leu 
2646 TTT GAT GAA ATT AGA ATG ACC TAC ATC AAA GAG. CTA GCA AAA 

532>Phe Asp Gl u Me Arg Met Thr Tyr Me Lys Gi u Leu Gl y Lys 
2688 GCC ATT GTC AAG AGG GAA GGA AAC TCC AGC CAG AAC TGG CAG 

546>Ala Me Val Lys Arg Gl u GI y Asn Ser Ser Gin Asn Trp Gin 
2730 CGG TTT TAT CAA CTC ACA AAA CTC TTG GAT TCT ATG CAT GAA 

560>Arg Phe Tyr Gin Leu Thr Lys Leu Leu Asp Ser Met His Gl u 
2772 GTG GTT GAA AAT CTC CTT AAC TAT TGC TTC CAA ACA TTT TTG 

574> Val Val Gl u Asn Leu Leu Asn Tyr Cys Phe Gin Thr Phe Leu 
2814 GAT AAG ACC ATG TCC ACC GAG TTC CCC GAG ATG TTA GCT GAA 

588> Asp Lys Thr Met Ser Thr Gl u Phe Pro Gl u Met Lou Ala Gl u 
2856 ATC ATC ACC AAT CAG ATA CCA AAA TAT TCA AAT GGA AAT ATC 

602> Me Me Thr Asn Gin Me Pro Lys Tyr Ser Asn Gl y Asn Me 

Kpnl 

2898 AAA AAA CTT CTG TTT CAT CAA AAG GGT ACC AGC CGT GGA GGG 

616> Lys Lys Leu Leu Phe His Gin Lys Gl y Thr Ser Arg Gl y Gl y 
2940 GCA TCC GTG GAG GAG ACG GAC CAA AGC CAC TTG GCC ACT GCG 

630> Ala Ser Val Gl u Gl u Thr Asp Gin Ser His Leu A! a Thr Ala 
2982 GCC TCT ACT TCA TCG CAT TCC TTG CAA AAG TAT TAC ATC ACG 

644>G!y Ser Thr Ser, Ser His Ser Leu Gin Lys Tyr Tyr Me Thr 
3024 GGG GAG GCA GAG GGT TTC CCT GCC ACA GTC TGA GAGCTCCCTC 

658>Gly Glu Ala Gl u Gl y Phe Pro Ala Thr Val 
EcoRI 

3067 GAATTCGGAT CTTATTAAAG CAGAACTTGT TTATTGCAGC TTATAATGCT 
3117 TACAAATAAA GCAATAGCAT CACAAATTTC ACAAATAAAG CATTTTTTTC 
3167 ACTGCATTCT AGTTGTGGTT TGTCCAAACT CATCAATGTA TCTTATCATG 
Sail 

3217 TCTGGTCGAC TCTAGACTCT TCCGCTTCCT CGCTCACTGA CTCGCTGCGC 
3267 TCGGTCGTTC GGCTGCGGCG AGCGGTATCA GCTCACTCAA AGGCGGTAAT 
3317 ACGGTTATCC ACAGAATCAG GGGATAACGC AGGAAAGAAC ATGTGAGCAA 
3367 AAGGCCAGCA AAAGGCCAGG AACCGTAAAA AGGCCGCGTT GCTGGCGTTT 
3417 TTCCATAGGC TCCGCCCCCC TGACGAGCAT CACAAAAATC GACGCTCAAG 
34 67 TCAGAGGTGG CGAAACCCGA CAGGACTATA AAGATACCAG GCGTTTCCCC 
3517 CTGGAAGCTC CCTCGTGCGC TCTCCTGTTC CGACCCTGCC GCTTACCGGA 
3567 TACCTGTCCG CCTTTCTCCC TTCGGGAAGC GTGGCGCTTT CTCATAGCTC 
3617 ACGCTGTAGG TATCTCAGTT CGGTGTAGGT CGTTCGCTCC AAGCTGGGCT 
3667 GTGTGCACGA ACCCCCCGTT CAGCCCGACC GCTGCGCCTT ATCCGGTAAC 
3717 TATCGTCTTG AGTCCAACCC GGTAAGACAC GACTTATCGC CACTGGCAGC 
3767 AGCCACTGGT AACAGGATTA GCAGAGCGAG GTATGTAGGC GGTGCTACAG 
3817 AGTTCTTGAA GTGGTGGCCT AACTACGGCT ACACTAGAAG GACAGTATTT 
3867 GGTATCTGCG CTCTGCTGAA GCCAGTTACC TTCGGAAAAA GAGTTGGTAG 
3917 CTCTTGATCC GGCAAACAAA CCACCGCTGG TAGCGGTGGT TT T TTTGTTT 
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3967 GCAAGCAGCA GATTACGCGC AGAAAAAAAG GATCTCAAGA AGATCCTTTG 
4017 ATCTTTTCTA CGGGGTCTGA CGCTCAGTGG AACGAAAACT CACGTTAAGG 
4067 GATTTTGGTC ATGAGATTAT CAAAAAGGAT CTTCACCTAG ATCCTTTTAA 
4117 ATTAAAAATG AAGTTTTAAA TCAATCTAAA GTATA7ATGA G7AAACT7GG 
4167 TCTGACAGTT ACCAATGCTT AATCAGTGAG GCACCTATCT CAGCGATCTG 
4217 TCTATTTCGT TCATCCATAG TTGCCTGACT CCCCGTCGTG TAGAT.AACTA 
4267 CGATACGGGA GGGCTTACCA TCTGGCCCCA GTGCTGCAAT GATACCGCGA 
4 317 GACCCACGCT CACCGGCTCC AGATTTATCA GCAATAAACC AGCCAGCCGG 
4367 AAGGGCGGAG CGCAGAAGTG GTCCTGCAAC TTTATCCGCC TCCATCCAGT 
4417 CTATTAATTC TTGCCGGGAA GCTAGAGTAA GTAGTTCGGC AGTTAATAGT 
4467 TTGCGCAACG TTGTTGCCAT TGCTACAGGC ATCGTGGTGT CACGCTCGTC 
4517 GTTTGGTATG GCTTCATTCA GCTCCGGTTC CCAACGATCA AGGCGAGTTA 
4 567 CATGATCCCC CATGTTGTGC AAAAAAGCGG TTAGCTCCTT CGGTCCTCCG 
4617 ATCGTTGTCA GAAGTAAGTT GGCCGCAGTG TTATCACTCA TGGTTATGGC 
4667 AGCACTGCAT AATTCTCTTA CTGTCATGCC ATCCGTAAGA TGCTTTTCTG 
4717 TGACTGGTGA GTACTCAACC AAGTCATTCT GAGAATAGTG TATGCGGCGA 
4767 CCGAGTTGCT CTTGCCCGGC GTCAATACGG GATAATACCG CGCCAGATAG 
4817 CAGAACTTTA AAAGTGCTCA TCATTGGAAA ACGTTCTTCG GGGCGAAAAC 
4867 TCTCAAGGAT CTTACCGCTG TTGAGATCCA GTTCGATGTA ACCCACTCGT 
4917 GCACCCAACT GATCTTCAGC ATCTTTTACT TTCACCAGCG TTTCTGGGTG 
4967 AGCAAAAACA GGAAGGCAAA ATGCCGCAAA AAAGGGAATA AGGGGGAGAC 
5017 GGAAATGTTG AATACTCATA CTCTTCCTTT TTCAATATTA TTGAAGCATT 
5067 TATCAGGGTT ATTGTCTCAT GAGCGGATAC ATATTTGAAT GTATTTAGAA 
5117 AAATAAACAA ATAGGGGTTC CGCGCACATT TCCCCGAAAA GTGCCACCTG 
5167 ACGTCTAAGA AACCATTATT ATCATGACAT TAACCTATAA AAATAGGCGT 
5217 ATCACGAGGC CCCTTTCGTC TCGCGCGTTT CGGTGATGAC GGTGAAAACC 
5267 TCTGACACAT GCAGCTCCCG GAGACGGTCA CAGCTTGTCT GTAAGCGGAT 
5317 GCCGGGAGCA GACAAGCCCG TCAGGGCGCG TCAGCGGGTG TTGGCGGGTG 
5367 TCGGGGCTGG CTTAACTATG CGGCATCAGA GCAGATTGTA C7GAGAG7GC 
5417 ACCATATGCG GTGTGAAATA CCGCACAGAT GCGTAAGGAG AAAATACCGC 
54 67 ATCAGGAAAT TGTAAACGTT AATATTTTGT TAAAATTCGG GTTAAATTTT 
5517 TGTTAAATCA GCTCATTTTT TAACCAATAG GCGGAAATCG GCAAAATCCC 
5567 TTATAAATCA AAAGAATAGA CCGAGATAGG GTTGAGTGTT GTTCCAGTTT 
5617 GGAACAAGAG TCCACTATTA AAGAACGTGG ACTCCAACGT CAAAGGGCGA 
5667 AAAACCGTCT ATCAGGGCGA TGGGCCACTA CGTGAACCAT CACCCTAATC 
5717 AAGTTTTTTG GGGTCGAGGT GCCGTAAAGC ACTAAATCGG AACCCTAAAG 
5767 GGAGCCCCCG ATTTAGAGCT TGACGGGGAA AGCCGGGGAA CGTGGCGAGA 
5817 AAGGAAGGGA AGAAAGCGAA AGGAGCGGGC GCTAGGGCGG TGGCAAGTGT 
5867 AGCGGTCACG CTGCGCGTAA CCACCACACC CGCCGCGCTT AATGCGCCCC 
5917 TACAGGGCGC GTCGCGCCAT TCGCCATTCA GGCTGCGCAA CTGTTGGGAA 
5967 GGGCGATCGG TGCGGGCCTC TTCGCTATTA CGCCAGGTGG CGAAAGGGGG 
6017 ATGTGCTGCA AGGCGATTAA GTTGGGTAAC GCCAGGGTTT TCCGAGTCAC 
6067 GACGTTGTAA AACGACGGCC AGTGAATT 
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